यह शोधपत्र वीडियो डिफ्यूज़न कन्वर्टर्स के ध्यान तंत्र पर कलात्मक और तकनीकी शोध प्रस्तुत करता है। नए दृश्य सौंदर्यशास्त्र बनाने के लिए एनालॉग वीडियो संकेतों में हेरफेर करने वाले शुरुआती वीडियो कलाकारों से प्रेरित होकर, यह अध्ययन जनरेटिव वीडियो मॉडल से क्रॉस-अटेंशन मैप्स निकालने और उन्हें विज़ुअलाइज़ करने की एक विधि प्रस्तावित करता है। ओपन-सोर्स वान मॉडल पर निर्मित, यह उपकरण टेक्स्ट-टू-वीडियो निर्माण में ध्यान के कालिक और स्थानिक व्यवहार की एक व्याख्यात्मक झलक प्रदान करता है। खोजपूर्ण शोध और कलात्मक केस स्टडीज़ के माध्यम से, हम ध्यान मैप्स को एक विश्लेषणात्मक उपकरण और कच्ची कलात्मक सामग्री, दोनों के रूप में उपयोग करने की संभावनाओं का पता लगाते हैं। यह शोध कला के लिए व्याख्यात्मक एआई (XAIxArts) के बढ़ते क्षेत्र में योगदान देता है, और कलाकारों को एक रचनात्मक माध्यम के रूप में एआई की आंतरिक कार्यप्रणाली को पुनः प्राप्त करने के लिए आमंत्रित करता है।