본 논문은 와이드 앵글 카메라의 왜곡으로 인한 얼굴 왜곡 문제를 해결하기 위해, 트랜스포머의 장거리 인식과 확산 모델의 다단계 잡음 제거를 통합한 구조-세부 묘사 초상화 보정 모델인 ImagePC를 제안합니다. 이후 비디오 레이블 확보의 어려움을 고려하여, 공간적 일관성과 시간적 부드러움 제약 조건을 갖는 시공간 확산 적응을 통해 비표시 와이드 앵글 비디오에 ImagePC를 재활용한 VideoPC를 제시합니다. VideoPC는 공간적으로 고품질의 얼굴 보정을 유지하면서, 블라인드 시나리오에서 시간적 흔들림을 순차적으로 완화합니다. 다양한 사람 수, 조명 조건, 배경을 포함하는 비디오 초상화 데이터셋을 구축하여 성능을 평가하고 모델을 학습시켰으며, 기존 방식보다 정량적, 정성적으로 우수한 성능을 보임을 실험을 통해 입증했습니다. 코드와 데이터셋을 공개할 예정입니다.