दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एक चुंबन का ध्यान: XAIxArts के लिए वीडियो प्रसार में ध्यान मानचित्रों की खोज

Created by
  • Haebom

लेखक

एडम कोल, मिक ग्रियर्सन

रूपरेखा

यह शोधपत्र वीडियो डिफ्यूज़न कन्वर्टर्स के ध्यान तंत्र पर कलात्मक और तकनीकी शोध प्रस्तुत करता है। नए दृश्य सौंदर्यशास्त्र बनाने के लिए एनालॉग वीडियो संकेतों में हेरफेर करने वाले शुरुआती वीडियो कलाकारों से प्रेरित होकर, यह अध्ययन जनरेटिव वीडियो मॉडल से क्रॉस-अटेंशन मैप्स निकालने और उन्हें विज़ुअलाइज़ करने की एक विधि प्रस्तावित करता है। ओपन-सोर्स वान मॉडल पर निर्मित, यह उपकरण टेक्स्ट-टू-वीडियो निर्माण में ध्यान के कालिक और स्थानिक व्यवहार की एक व्याख्यात्मक झलक प्रदान करता है। खोजपूर्ण शोध और कलात्मक केस स्टडीज़ के माध्यम से, हम ध्यान मैप्स को एक विश्लेषणात्मक उपकरण और कच्ची कलात्मक सामग्री, दोनों के रूप में उपयोग करने की संभावनाओं का पता लगाते हैं। यह शोध कला के लिए व्याख्यात्मक एआई (XAIxArts) के बढ़ते क्षेत्र में योगदान देता है, और कलाकारों को एक रचनात्मक माध्यम के रूप में एआई की आंतरिक कार्यप्रणाली को पुनः प्राप्त करने के लिए आमंत्रित करता है।

Takeaways, Limitations

Takeaways:
वीडियो डिफ्यूजन ट्रांसफॉर्मर्स के ध्यान तंत्र को देखने और विश्लेषण करने के लिए एक नवीन विधि प्रस्तुत की गई है।
पाठ से वीडियो निर्माण प्रक्रिया की समझ में वृद्धि।
कलात्मक रचनात्मक गतिविधियों में ध्यान मानचित्रों के उपयोग की संभावना का सुझाव देना।
XAIxArts के क्षेत्र में योगदान।
Limitations:
चूंकि यह अध्ययन वान मॉडल पर आधारित है, इसलिए अन्य मॉडलों पर इसका सामान्यीकरण सीमित है।
ध्यान मानचित्रों की व्याख्या में व्यक्तिपरकता विद्यमान है।
कलात्मक केस अध्ययन का दायरा सीमित है।
👍