Este artículo aborda la conversión de artículos de investigación en resúmenes de video estructurados. Destacamos las limitaciones de los modelos de generación de video de vanguardia, que presentan ventanas de contexto limitadas, restricciones de duración fija, diversidad de estilos limitada y la incapacidad de representar el conocimiento específico del dominio. Para abordar estas limitaciones, presentamos "Preacher", el primer sistema de agente de conversión de artículos. Preacher descompone, resume y reconstruye artículos mediante un enfoque descendente, combinando varios segmentos de video para generar videos de resumen coherentes. Definimos escenas clave para alinear representaciones intermodales e introducimos la Cadena Progresiva de Pensamiento (P-CoT) para una planificación iterativa detallada. Preacher genera con éxito resúmenes de video de alta calidad en cinco áreas de investigación, demostrando una experiencia que supera a los modelos de generación de video existentes.