दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

सेमइवल-2025 टास्क 5 में एनिफ: एलएलएम द्वारा संवर्धित पारंपरिक एक्सएमटीसी

Created by
  • Haebom

लेखक

ओस्मा सुओमिनेन, जुहो इंकिनेन, मोना लेहटीनेन

रूपरेखा

यह शोधपत्र SemEval-2025 कार्य 5 (LLMs4Subjects) में वृहत्-स्तरीय भाषा मॉडल (LLMs) का उपयोग करके विषय अनुक्रमण हेतु Annif प्रणाली प्रस्तुत करता है। इस कार्य के लिए द्विभाषी TIBKAT डेटाबेस में ग्रंथसूची अभिलेखों के लिए वैश्विक तंत्रिका नेटवर्क (GND) विषय शब्दावली का उपयोग करके विषय पूर्वानुमान उत्पन्न करना आवश्यक था। Annif प्रणाली, Annif टूलकिट में कार्यान्वित मौजूदा प्राकृतिक भाषा प्रसंस्करण और मशीन लर्निंग तकनीकों को अनुवाद और संश्लेषित डेटा निर्माण के लिए एक नवीन LLM-आधारित विधि, साथ ही जापानी मॉडलों के पूर्वानुमान विलयन के साथ जोड़ती है। मात्रात्मक मूल्यांकन में, इसने सभी विषय श्रेणियों में प्रथम, tib-कोर-विषय श्रेणी में द्वितीय, और गुणात्मक मूल्यांकन में चौथा स्थान प्राप्त किया। ये परिणाम बहुभाषी परिवेशों में विषय अनुक्रमण की सटीकता और दक्षता में सुधार के लिए मौजूदा XMTC एल्गोरिथम को आधुनिक LLM तकनीकों के साथ संयोजित करने की क्षमता को प्रदर्शित करते हैं।

____T98072_____, Limitations

Takeaways:
मौजूदा प्राकृतिक भाषा प्रसंस्करण और मशीन लर्निंग तकनीकों को एलएलएम-आधारित तकनीकों के साथ जोड़कर बहुभाषी विषय अनुक्रमण कार्यों की सटीकता और दक्षता में सुधार की संभावना प्रस्तुत की गई है।
एनिफ प्रणाली का उत्कृष्ट प्रदर्शन एलएलएम का उपयोग करके विषय अनुक्रमण के क्षेत्र में उन्नति की संभावना की पुष्टि करता है।
बहुभाषी वातावरण में विषय अनुक्रमण के लिए एक प्रभावी दृष्टिकोण प्रस्तुत करना।
Limitations:
गुणात्मक मूल्यांकन में चौथे स्थान पर होने के कारण, यह मात्रात्मक मूल्यांकन के परिणामों से भिन्न है। गुणात्मक मूल्यांकन के मानदंडों और परिणामों की विस्तृत व्याख्या आवश्यक है।
एलएलएम और प्रयुक्त अन्य तकनीकों के विस्तृत विवरण का अभाव। पुनरुत्पादन सुनिश्चित करने के लिए अतिरिक्त जानकारी की आवश्यकता है।
👍