본 논문은 초고해상도의 사실적인 3D 헤드 아바타의 실시간 애니메이션 생성에 초점을 맞추고 있습니다. 특히, 미세한 얼굴 표정과 움직임을 표현하기 위해 국소적으로 정의된 얼굴 표정과 3D Gaussian splatting을 결합하는 새로운 방법을 제안합니다. 기존의 전역 표정 공간 기반 방법과 달리, 패치 기반의 국소 표정 특징을 활용하여 아바타의 역동성을 조절하고, 패치 단위로 3D Gaussian을 합성합니다. 패치 기반의 기하학적 3D 얼굴 모델을 이용하여 패치 표정을 추출하고, Scaffold-GS라는 계층적 장면 표현의 앵커 포인트와 패치를 결합하여 국소적인 피부 외관과 움직임을 학습합니다. 이러한 앵커 포인트는 패치 표정과 시점에 따라 3D Gaussian을 실시간으로 합성하는 데 사용됩니다. 색상 기반 밀도 증가 및 점진적 학습을 통해 고품질 결과와 빠른 수렴을 달성하며, 3K 고해상도 이미지를 사용하여 훈련합니다. 패치 수준의 표정을 활용함으로써, ScaffoldAvatar는 다양한 얼굴 표정과 스타일을 실시간으로 포괄하면서 시각적으로 자연스러운 움직임으로 최첨단 성능을 달성합니다.