Para abordar el problema de la distorsión facial causada por las cámaras gran angular, este artículo propone ImagePC, un modelo de corrección de retratos con detalle estructural que integra el reconocimiento de largo alcance de Transformers y la eliminación de ruido multietapa de los modelos de difusión. Considerando la dificultad de obtener etiquetas de video, proponemos VideoPC, una versión reutilizada de ImagePC para videos gran angular sin etiquetar, que utiliza la adaptación de difusión espaciotemporal con restricciones de consistencia espacial y suavidad temporal. VideoPC mitiga secuencialmente el desenfoque temporal en escenarios de ceguera, manteniendo una corrección facial espacial de alta calidad. Evaluamos el rendimiento y entrenamos el modelo en un conjunto de datos de retratos de video que contiene un conjunto diverso de personas, condiciones de iluminación y fondos, y demostramos mediante experimentos que supera a los métodos existentes tanto cualitativa como cuantitativamente. El código y el conjunto de datos se publicarán próximamente.