Cet article examine l'état actuel de la génération de vidéos longues durées. Il met en évidence les défis de cette génération (planification, narration, maintien de la cohérence spatiale et temporelle, etc.) en soulignant les limites des systèmes de pointe existants pour la génération de vidéos d'une minute. Il couvre l'ensemble du domaine de la génération de vidéos longues durées, y compris les techniques fondamentales telles que les réseaux antagonistes génératifs (GAN) et les modèles de diffusion, les stratégies de génération vidéo, les jeux de données d'entraînement à grande échelle, les indicateurs de qualité pour l'évaluation des vidéos longues durées et les axes de recherche futurs. Il suggère le potentiel d'une évolutivité accrue et d'un contrôle accru en intégrant une approche « diviser pour mieux régner » à l'IA générative. Enfin, il vise à fournir une base solide pour l'avancement et la recherche en génération de vidéos longues durées.