दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

कमांडर-जीपीटी: मल्टी-मोडल लार्ज लैंग्वेज मॉडल की व्यंग्य पहचान क्षमता को पूरी तरह से उन्मुक्त करना

Created by
  • Haebom

लेखक

याज़हौ झांग, चुनवांग ज़ो, बो वांग, जिंग किन

रूपरेखा

यह शोधपत्र व्यंग्य पहचान पर केंद्रित है, जो प्राकृतिक भाषा प्रसंस्करण के क्षेत्र में एक महत्वपूर्ण शोध विषय है। एकल मोडल तरीके (जैसे, पाठ) में मौजूदा व्यंग्य पहचान विधियां अक्सर व्यंग्य की अंतर्निहित और सूक्ष्म प्रकृति के कारण संतोषजनक परिणाम प्राप्त करने में विफल रहती हैं। इस शोधपत्र में, हम मल्टीमॉडल दृष्टिकोण पर ध्यान केंद्रित करते हैं और एक अभिनव मल्टीमॉडल कमांडर-जीपीटी फ्रेमवर्क का प्रस्ताव करते हैं जो विभिन्न सूचना स्रोतों के लिए शक्तिशाली एकीकृत प्रसंस्करण क्षमताओं के साथ एक मल्टीमॉडल बड़े पैमाने पर भाषा मॉडल (एमएलएलएम) का लाभ उठाता है। सैन्य रणनीति से प्रेरित होकर, हम व्यंग्य पहचान कार्य को छह उप-कार्यों में विभाजित करते हैं, और एक केंद्रीय कमांडर (निर्णय निर्माता) प्रत्येक उप-कार्य को सबसे उपयुक्त बड़े पैमाने पर भाषा मॉडल प्रदान करता है। अंत में, व्यंग्य की पहचान करने के लिए प्रत्येक मॉडल के पहचान परिणामों को एकत्रित किया जाता है। चार मल्टीमॉडल बड़े पैमाने के भाषा मॉडल और छह प्रॉम्प्टिंग रणनीतियों का उपयोग करके एमएमएसडी और एमएमएसडी 2.0 डेटासेट पर व्यापक प्रयोगों के माध्यम से, हम बिना किसी फाइन-ट्यूनिंग या ग्राउंड ट्रुथ के 19.3% के एफ 1 स्कोर सुधार के साथ अत्याधुनिक प्रदर्शन प्राप्त करते हैं।

Takeaways, Limitations

Takeaways:
मल्टीमॉडल बड़े पैमाने के भाषा मॉडल का उपयोग करते हुए एक नया व्यंग्य पहचान ढांचा (कमांडर-जीपीटी) प्रस्तुत किया गया है।
उपकार्य विघटन और मॉडल असाइनमेंट रणनीतियों के माध्यम से कुशल बहु-मोडल सूचना उपयोग
बिना किसी फाइन-ट्यूनिंग या ग्राउंड ट्रुथ के अत्याधुनिक प्रदर्शन प्राप्त करना (F1 स्कोर में 19.3% सुधार)
विभिन्न सूचना स्रोतों को एकीकृत करके व्यंग्य पहचान प्रदर्शन में सुधार की संभावना
Limitations:
प्रस्तावित ढांचे के सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।
उपयोग किए गए डेटासेट पर निर्भरता और अन्य डेटासेट के लिए मापनीयता को सत्यापित करने की आवश्यकता है
विभिन्न प्रकार के व्यंग्य की मजबूती का आकलन आवश्यक
छह उपकार्य विघटन मानदंड और मॉडल आवंटन रणनीति के अनुकूलन पर आगे अनुसंधान की आवश्यकता है।
👍