दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ऑटैलिक: संदर्भ में एंटी-ऑटिस्टिक एबलिस्ट भाषा के लिए एक डेटासेट

Created by
  • Haebom

लेखक

नाबा रिज़वी, हार्पर स्ट्रिकलैंड, डेनियल गिटेलमैन, ट्रिस्टन कूपर, एलेक्सिस मोरालेस-फ्लोरेस, माइकल गोल्डन, एक्टा कल्लेपल्ली, अक्षत अलुरकर, हासेट ओवेन्स, सालेहा अहमदी, ईशा खिरवाडकर, इमानी मुन्याका, नेदजमा औसिधौम

रूपरेखा

जैसे-जैसे ऑटिज़्म और एबलिज़्म की समझ बढ़ती है, वैसे-वैसे ऑटिज़्म से जुड़ी एबलिज़्म भाषा की हमारी समझ भी बढ़ती है। यह भाषा अपनी सूक्ष्म और संदर्भ-निर्भर प्रकृति के कारण एनएलपी अनुसंधान के लिए गंभीर चुनौतियाँ प्रस्तुत करती है। हालाँकि, ऑटिज़्म-विरोधी एबलिज़्म भाषा का पता लगाना अभी भी एक अनन्वेषित क्षेत्र है, और मौजूदा एनएलपी उपकरण अक्सर इसकी सूक्ष्म अभिव्यक्तियों को पकड़ने में विफल रहते हैं। इस पत्र में, हम AUTALIC प्रस्तुत करके इस महत्वपूर्ण अंतर को दूर करते हैं, जो संदर्भ में एंटी-ऑटिज़्म एबलिज़्म भाषा का पता लगाने के लिए समर्पित पहला बेंचमार्क डेटासेट है। इस डेटासेट में रेडिट से एकत्रित 2,400 ऑटिज़्म-संबंधी वाक्य और उनके आसपास के संदर्भ शामिल हैं, जिन्हें न्यूरोडाइवर्सिटी की पृष्ठभूमि वाले अनुभवी विशेषज्ञों द्वारा एनोटेट किया गया है। व्यापक मूल्यांकन दर्शाते हैं कि वर्तमान भाषा मॉडल, जिनमें अत्याधुनिक एलएलएम शामिल हैं, एंटी-ऑटिज़्म एबलिज़्म की विश्वसनीय रूप से पहचान करने और मानवीय निर्णय से मेल खाने के लिए संघर्ष करते हैं, जो इस क्षेत्र की सीमाओं को उजागर करता है। AUTALIC को उसके व्यक्तिगत एनोटेशन के साथ सार्वजनिक रूप से जारी करके, हम सक्षमतावाद, तंत्रिका-विविधता और एनोटेशन प्रयासों में विसंगतियों का अध्ययन करने वाले शोधकर्ताओं के लिए एक मूल्यवान संसाधन प्रदान करते हैं। यह डेटासेट अधिक व्यापक और संदर्भ-जागरूक एनएलपी प्रणालियों को विकसित करने की दिशा में एक महत्वपूर्ण कदम है जो विविध दृष्टिकोणों को बेहतर ढंग से प्रतिबिंबित करते हैं।

Takeaways, Limitations

Takeaways: ऑटिस्टिक-एबलिस्टिक भाषा पहचान के लिए पहला बेंचमार्क डेटासेट, AUTALIC प्रदान करके NLP अनुसंधान में महत्वपूर्ण योगदान दिया। इसने मौजूदा भाषा मॉडलों की सीमाओं को उजागर किया और अधिक व्यापक NLP प्रणालियों की आवश्यकता पर प्रकाश डाला। इसने न्यूरोडायवर्सिटी अनुसंधान और एनोटेशन कार्य बेमेल अध्ययनों के लिए बहुमूल्य जानकारी भी प्रदान की।
Limitations: चूँकि यह डेटासेट रेडिट से एकत्रित डेटा पर आधारित है, इसलिए यह प्लेटफ़ॉर्म-विशिष्ट विशेषताओं को दर्शा सकता है। एनोटेशन कार्यों में असंगति के मुद्दे को भविष्य के शोध में और अधिक संबोधित किया जाना चाहिए। वर्तमान में, खराब भाषा मॉडल प्रदर्शन के कारणों का गहन विश्लेषण उपलब्ध नहीं है।
👍