दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

कार्य महत्वपूर्ण: ज्ञान की आवश्यकताएं संदर्भ-स्मृति संघर्ष के प्रति एलएलएम प्रतिक्रियाओं को आकार देती हैं

Created by
  • Haebom

लेखक

कैसर सन, फैन बाई, मार्क ड्रेडेज़

रूपरेखा

यह शोधपत्र इस समस्या का समाधान करता है कि बड़े पैमाने के भाषा मॉडल (एलएलएम) के लिए प्रासंगिक ज्ञान और पैरामीटर स्मृति दोनों की आवश्यकता होती है, फिर भी सूचना के ये दोनों स्रोत परस्पर विरोधी हो सकते हैं। पिछले शोधों में संघर्ष की स्थितियों में पैरामीटर ज्ञान को प्राथमिकता दी गई है, लेकिन केवल उन कार्यों पर ध्यान केंद्रित किया गया है जिनमें किसी दिए गए वाक्य पर निर्भरता की आवश्यकता होती है। यह अध्ययन एक मॉडल-स्वतंत्र निदान ढाँचे का उपयोग करता है जो मॉडल की मान्यताओं और एक क्यूरेटेड ज्ञान समूह के बीच बेमेल का स्वतः पता लगाता है और कार्य में नियंत्रित संघर्षों को शामिल करता है। हम जाँच करते हैं कि कार्य के लिए आवश्यक ज्ञान की मात्रा और प्रकार के आधार पर यह व्यवहार कैसे प्रकट होता है। दो परस्पर लंबवत आयामों (कार्य ज्ञान निर्भरता और संघर्ष वैधता) को समाहित करने वाले डेटासेट का उपयोग करते हुए, हम एक प्रतिनिधि ओपन-सोर्स एलएलएम का मूल्यांकन करते हैं और पाते हैं कि संघर्षों के कारण प्रदर्शन में गिरावट कार्य की ज्ञान निर्भरता से संबंधित है। इसके अलावा, हम पाते हैं कि व्याख्यात्मक साक्ष्य और सरल पुनरावृत्ति प्रासंगिक निर्भरता को बढ़ाते हैं, लेकिन जब पैरामीटर ज्ञान को प्रमुखता देनी चाहिए तो ये हानिकारक होते हैं। यह व्यवहार मॉडल-आधारित मूल्यांकनों की वैधता के बारे में चिंताएँ पैदा करता है और एलएलएम को लागू करते समय ज्ञान संघर्षों पर विचार करने की आवश्यकता पर प्रकाश डालता है।

Takeaways, Limitations

Takeaways:
एलएलएम के प्रदर्शन में गिरावट कार्य की ज्ञान निर्भरता और संघर्ष की डिग्री पर निर्भर करती है।
व्याख्यात्मक औचित्य और सरल पुनरावृत्ति संदर्भ निर्भरता को बढ़ा सकती है, लेकिन वास्तव में स्थिति के आधार पर प्रदर्शन को कम कर सकती है।
मॉडल-आधारित मूल्यांकन की वैधता के बारे में चिंता जताई गई है और एलएलएम वितरित करते समय ज्ञान संघर्षों पर विचार करने के महत्व पर जोर दिया गया है।
Limitations:
ओपन-सोर्स एलएलएम के प्रकार और इस अध्ययन में प्रयुक्त डेटासेट की सीमाएँ।
मॉडल-स्वतंत्र नैदानिक ​​ढाँचे की सामान्यता का पता लगाने के लिए और अधिक शोध की आवश्यकता है।
विभिन्न प्रकार के ज्ञान संघर्षों और एलएलएम की परिणामी प्रतिक्रियाओं का अधिक गहन विश्लेषण आवश्यक है।
👍