दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

धाराप्रवाह लेकिन भावशून्य: भाषा मॉडल के भावनात्मक अंधे धब्बे

Created by
  • Haebom

लेखक

बंगझाओ शू, ईशा जोशी, मेलिसा कर्नाज़े, अन्ह सी. फाम, इशिता कक्कड़, सिंधु कोठे, अर्पाइन होवासैपियन, माई एलशेरिफ़

रूपरेखा

यह शोधपत्र बड़े पैमाने के भाषा मॉडल (एलएलएम) की भावना पहचान क्षमताओं का अन्वेषण करता है। पिछले अध्ययनों के विपरीत, जो भावनाओं को सीमित श्रेणियों में वर्गीकृत करते हैं, हम एक नया बेंचमार्क डेटासेट, एक्सप्रेस, प्रस्तुत करते हैं, जिसमें रेडिट समुदाय से एकत्रित 251 सूक्ष्म-स्तरीय स्व-रिपोर्ट किए गए भावना लेबल शामिल हैं। हम विभिन्न प्रॉम्प्ट सेटिंग्स के तहत कई एलएलएम का व्यवस्थित रूप से मूल्यांकन करते हैं और मानवीय स्व-रिपोर्ट के अनुरूप भावनाओं का सटीक अनुमान लगाने में उनकी कठिनाई को प्रदर्शित करते हैं। गुणात्मक विश्लेषण से पता चलता है कि कुछ एलएलएम मौजूदा भावना सिद्धांत और परिभाषाओं के अनुरूप भावना शब्द उत्पन्न करते हैं, लेकिन वे मानवीय स्व-रिपोर्ट की तरह प्रभावी रूप से प्रासंगिक संकेतों को पकड़ने में विफल रहते हैं। इसलिए, यह अध्ययन सूक्ष्म-स्तरीय भावना संगति में एलएलएम की सीमाओं को उजागर करता है और प्रासंगिक समझ को बेहतर बनाने के उद्देश्य से भविष्य के शोध के लिए अंतर्दृष्टि प्रदान करता है।

Takeaways, Limitations

Takeaways:
सूक्ष्म भावना पहचान के लिए एक नया बेंचमार्क डेटासेट (एक्सप्रेस) प्रस्तुत किया गया है।
एलएलएम की सूक्ष्म भावनाओं की भविष्यवाणी करने की क्षमता और इसकी सीमाओं का एक व्यवस्थित मूल्यांकन।
एलएलएम छात्रों की संदर्भ को समझने की क्षमता में सुधार करने के लिए अनुसंधान दिशाओं का सुझाव देना।
Limitations:
रेडिट डेटा पर आधारित डेटासेट की सीमित सामान्यीकरण क्षमता।
स्व-रिपोर्ट की गई भावनाओं की व्यक्तिपरकता के कारण सटीकता में कमी की संभावना
मूल्यांकन में प्रयुक्त एलएलएम के प्रकारों और संस्करणों की सीमाओं के कारण सामान्यीकरण में कठिनाइयाँ।
👍