दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

बहु-परीक्षण के माध्यम से बड़े भाषा मॉडल में मतिभ्रम का सिद्धांत-आधारित पता लगाना

Created by
  • Haebom

लेखक

जियावेई ली, अक्षय मगेश, वेणुगोपाल वी. वीरावल्ली

रूपरेखा

यह शोधपत्र बड़े पैमाने के भाषा मॉडल (एलएलएम) में मतिभ्रम की समस्या पर विचार करता है। मतिभ्रम उस घटना को कहते हैं जिसमें एलएलएम आत्मविश्वास से भरी प्रतिक्रियाएँ उत्पन्न करता है, लेकिन वास्तव में गलत या निरर्थक प्रतिक्रियाएँ उत्पन्न करता है। यह शोधपत्र मतिभ्रम का पता लगाने को एक परिकल्पना परीक्षण समस्या के रूप में प्रस्तुत करता है और मशीन लर्निंग मॉडल में आउट-ऑफ-डिस्ट्रीब्यूशन डिटेक्शन समस्या से इसकी समानता प्रदर्शित करता है। हम बहु-परीक्षण से प्रेरित एक नवीन विधि का प्रस्ताव करते हैं और अत्याधुनिक विधियों के विरुद्ध इसकी सुदृढ़ता की पुष्टि के लिए व्यापक प्रयोगात्मक परिणाम प्रस्तुत करते हैं।

Takeaways, Limitations

Takeaways:
एलएलएम मतिभ्रम समस्या को परिकल्पना परीक्षण समस्या के रूप में सूत्रबद्ध करके एक नया दृष्टिकोण प्रस्तावित किया गया है।
हमने अनेक सत्यापन तकनीकों का उपयोग करके मतिभ्रम का पता लगाने के प्रदर्शन में सुधार किया।
प्रस्तावित विधि की मजबूती को प्रयोगात्मक रूप से सत्यापित किया गया।
Limitations:
प्रस्तावित विधि के सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।
विभिन्न प्रकार के एलएलएम और कार्यों पर अधिक प्रयोगात्मक परिणामों की आवश्यकता है।
मतिभ्रम को परिभाषित करने और मापने के लिए स्पष्ट मानदंडों की आवश्यकता है।
👍