Cet article présente des recherches artistiques et techniques sur le mécanisme d'attention des convertisseurs de diffusion vidéo. Inspirée par les premiers vidéastes qui manipulaient des signaux vidéo analogiques pour créer de nouvelles esthétiques visuelles, cette étude propose une méthode d'extraction et de visualisation de cartes d'attention croisée à partir de modèles vidéo génératifs. Basé sur le modèle open source Wan, notre outil offre une fenêtre interprétable sur le comportement temporel et spatial de l'attention lors de la conversion de texte en vidéo. À travers des recherches exploratoires et des études de cas artistiques, nous examinons le potentiel des cartes d'attention, à la fois comme outil d'analyse et comme ressource artistique brute. Cette étude contribue au domaine en plein essor de l'IA explicable pour l'art (XAIxArts), invitant les artistes à se réapproprier le fonctionnement interne de l'IA comme médium créatif.