본 논문은 얼굴 이미지 간 자세와 표정을 전이하는 새로운 방법을 제안합니다. 소스 얼굴 이미지와 타겟 얼굴 이미지를 입력받아, 소스 이미지의 자세와 표정을 타겟 이미지의 얼굴에 적용한 결과 이미지를 생성합니다. StyleGAN2의 잠재 공간을 활용하여 두 입력 이미지를 매핑 네트워크를 통해 처리하며, 여러 개인의 비디오 시퀀스로부터 자가 지도 학습을 진행하여 수동 라벨링이 필요 없습니다. 이 모델은 제어 가능한 자세와 표정을 가진 임의의 얼굴 이미지 합성을 가능하게 하며, 실시간에 가까운 성능을 달성합니다.