[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

चित्र बनाने से पहले सोचें: भावनाओं के अर्थ को विघटित करना और सूक्ष्म नियंत्रणीय अभिव्यंजक बातचीत का शीर्ष निर्माण

Created by
  • Haebom

लेखक

हनलेई शि, लेयुआन क्व, यू लियू, डि गाओ, युहुआ झेंग, ताइहाओ ली

रूपरेखा

इस शोधपत्र में, हम पाठ-आधारित भावनात्मक संवादात्मक शीर्ष निर्माण में मौजूदा विधियों की कमियों की ओर इशारा करते हैं और उन्हें दूर करने के लिए एक नवीन ढाँचा, "थिंक-बिफोर-ड्रा" प्रस्तावित करते हैं। थिंक-बिफोर-ड्रा, अमूर्त भाव लेबलों को शारीरिक रूप से आधारित चेहरे की मांसपेशियों की गति के विवरणों में बदलने के लिए विचार-श्रृंखला (CoT) का लाभ उठाता है, और "वैश्विक भाव स्थानीयकरण - स्थानीय मांसपेशी नियंत्रण" तंत्र के साथ एक उत्तरोत्तर निर्देशित शोर-निरोधन रणनीति के माध्यम से सूक्ष्म-अभिव्यक्ति गतिशीलता में सुधार करता है, जिससे स्वाभाविक भावनात्मक अभिव्यक्तियाँ प्राप्त होती हैं। हम MEAD और HDTF बेंचमार्क पर अत्याधुनिक प्रदर्शन प्राप्त करते हैं, और इसकी शून्य-शॉट निर्माण क्षमता का मूल्यांकन करने के लिए एक नवीन पोर्ट्रेट छवि डेटासेट भी प्रस्तुत करते हैं।

Takeaways, Limitations

Takeaways:
हम चेन-ऑफ-थॉट (सीओटी) का उपयोग करके भावनाओं के गहन अर्थगत विश्लेषण के माध्यम से पाठ-आधारित भावनात्मक बातचीत की स्वाभाविकता में सुधार करते हैं।
प्रगतिशील मार्गदर्शन शोर हटाने की रणनीति और "वैश्विक भावना स्थानीयकरण - स्थानीय मांसपेशी नियंत्रण" तंत्र सूक्ष्म अभिव्यक्तियों के परिष्कृत नियंत्रण को सक्षम बनाता है।
हम MEAD और HDTF बेंचमार्क पर अत्याधुनिक प्रदर्शन प्राप्त करके प्रस्तावित विधि की श्रेष्ठता प्रदर्शित करते हैं।
हम शून्य-शॉट उत्पादन क्षमताओं के मूल्यांकन के लिए एक नया डेटासेट प्रदान करते हैं।
Limitations:
प्रस्तुत नये डेटासेट के आकार और विविधता के बारे में विशिष्ट जानकारी का अभाव है।
यह निर्धारित करने के लिए आगे मात्रात्मक विश्लेषण की आवश्यकता है कि सीओटी का उपयोग भावनात्मक अभिव्यक्ति की स्वाभाविकता को सुधारने में कितना योगदान देता है।
यह निर्धारित करने के लिए आगे विश्लेषण की आवश्यकता है कि यह भावनात्मक अभिव्यक्तियों और व्यक्तिगत विशेषताओं की श्रृंखला को कितनी अच्छी तरह से पकड़ता है।
वास्तविक मानवीय भावनात्मक अभिव्यक्तियों से अंतर के मात्रात्मक मूल्यांकन का अभाव है।
👍