PFAvatar는 다양한 포즈, 폐색 및 복잡한 배경을 가진 OOTD 사진으로부터 고품질 3D 아바타를 재구성하는 새로운 방법입니다. 이 방법은 (1) 소수의 OOTD 예시로부터 포즈 인식 확산 모델을 미세 조정하고 (2) 신경 방사율 필드 (NeRF)로 표현되는 3D 아바타를 증류하는 두 단계로 구성됩니다. 이미지 분할을 거치지 않고 전체 신체 외관을 직접 모델링하며, 포즈 추정을 위한 사전 훈련된 ControlNet과 새로운 Condition Prior Preservation Loss (CPPL)를 통합하여 소수 샷 훈련에서 미세 디테일의 종단 간 학습을 가능하게 합니다. 5분 만에 개인화를 완료하며, 기존 방식보다 48배 빠른 속도를 보입니다. NeRF 기반 아바타 표현은 표준 SMPL-X 공간 샘플링 및 Multi-Resolution 3D-SDS를 사용하여 최적화됩니다. 실험 결과, PFAvatar는 재구성 충실도, 디테일 보존, 폐색/절단에 대한 견고성 측면에서 기존 SOTA 방법보다 우수하며, 가상 착용, 애니메이션, 인간 비디오 재연 등 다운스트림 응용 프로그램을 지원합니다.