दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

धति+: अरबी व्यक्तिपरकता मूल्यांकन के लिए परिष्कृत बड़े भाषा मॉडल

Created by
  • Haebom

लेखक

स्लीमेन बेलौअर, अत्तिया नेहर, सौमिया सौफ़ी, मौनिया बाउमेउर

रूपरेखा

यह शोधपत्र अरबी में व्यक्तिपरकता विश्लेषण के लिए एक नवीन दृष्टिकोण प्रस्तुत करता है। यद्यपि अरबी भाषा भाषाई रूप से समृद्ध और रूपात्मक रूप से जटिल है, फिर भी बड़े पैमाने पर एनोटेट किए गए डेटा का अभाव सटीक उपकरणों के विकास में बाधा डालता है। यह अध्ययन मौजूदा अरबी डेटासेट (ASTD, LABR, HARD, SANAD) का उपयोग करके एक व्यापक डेटासेट, AraDhati+, का निर्माण करता है और व्यक्तिपरकता वर्गीकरण करने के लिए अत्याधुनिक अरबी भाषा मॉडल (XLM-RoBERTa, AraBERT, ArabianGPT) को परिष्कृत करता है। इसके अतिरिक्त, एक समूह निर्णय-निर्माण दृष्टिकोण का उपयोग करके, हमने 97.79% की उच्च सटीकता प्राप्त की, जिससे यह प्रदर्शित होता है कि यह दृष्टिकोण अरबी प्रसंस्करण में संसाधन की कमी को दूर करने में प्रभावी है।

Takeaways, Limitations

Takeaways:
अरबी व्यक्तिपरकता और आराधाति+ डेटासेट का विश्लेषण करने के लिए एक नया दृष्टिकोण प्रस्तुत किया गया है।
अत्याधुनिक अरबी भाषा मॉडल का लाभ उठाकर उच्च सटीकता (97.79%) प्राप्त करना।
अरबी प्राकृतिक भाषा प्रसंस्करण के क्षेत्र में संसाधन की कमी की समस्या को हल करने में योगदान देना।
समूह तकनीकों के माध्यम से प्रदर्शन सुधार की संभावना प्रस्तुत करना।
Limitations:
आराधाति+ डेटासेट की संरचना और गुणवत्ता के विस्तृत विवरण का अभाव।
प्रयुक्त अरबी भाषा मॉडल की विशेषताओं और इसके चयन के कारणों के विस्तृत विवरण का अभाव।
अन्य व्यक्तिपरकता विश्लेषण पद्धतियों के साथ तुलनात्मक विश्लेषण का अभाव।
पूर्वाग्रह और सामान्यीकरण के लिए डेटासेट की समीक्षा का अभाव।
वास्तविक दुनिया के अनुप्रयोगों में प्रदर्शन मूल्यांकन का अभाव।
👍