Pour résoudre le problème de distorsion faciale causé par les caméras grand angle, cet article propose ImagePC, un modèle de correction de portraits aux détails structurels qui intègre la reconnaissance longue portée des Transformers et le débruitage multi-étapes des modèles de diffusion. Compte tenu de la difficulté d'obtenir des étiquettes vidéo, nous proposons VideoPC, une version réadaptée d'ImagePC pour les vidéos grand angle non étiquetées, utilisant l'adaptation spatio-temporelle par diffusion avec des contraintes de cohérence spatiale et de fluidité temporelle. VideoPC atténue séquentiellement le flou temporel dans les scénarios aveugles tout en maintenant une correction faciale spatiale de haute qualité. Nous évaluons les performances et entraînons le modèle sur un ensemble de données de portraits vidéo contenant un ensemble diversifié de personnes, de conditions d'éclairage et d'arrière-plans, et démontrons expérimentalement qu'il surpasse les méthodes existantes, tant sur le plan qualitatif que quantitatif. Le code et l'ensemble de données seront rendus publics ultérieurement.