दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

स्पष्ट ज्ञान सीमा मॉडलिंग के माध्यम से एलएलएम विश्वसनीयता को बढ़ाना

Created by
  • Haebom

लेखक

हैंग झेंग, होंगशेन जू, युनकोंग लियू, लू चेन, पास्केल फंग, काई यू

रूपरेखा

बड़े पैमाने के भाषा मॉडल (एलएलएम) ज्ञान की सीमाओं को पार करने वाले प्रश्नों को संसाधित करते समय आत्म-जागरूकता में बेमेल के कारण मतिभ्रम के प्रति संवेदनशील होते हैं। मौजूदा शमन रणनीतियाँ अनिश्चितता अनुमान या प्रश्न अस्वीकृति तंत्र का उपयोग करती हैं, लेकिन वे कम कम्प्यूटेशनल दक्षता और प्रयोज्यता से ग्रस्त हैं। इस पत्र में, हम एक स्पष्ट ज्ञान सीमा मॉडलिंग (ईकेबीएम) ढाँचा प्रस्तावित करते हैं जो विश्वसनीयता और प्रयोज्यता को संतुलित करने के लिए तेज़ और धीमी अनुमान प्रणालियों को एकीकृत करता है। ढाँचा पहले विश्वास-संकेतित प्रतिक्रियाएँ उत्पन्न करने के लिए एक तेज़ मॉडल का उपयोग करता है, जिससे उच्च-विश्वसनीय आउटपुट का तुरंत उपयोग किया जा सकता है। दूसरी ओर, अनिश्चित पूर्वानुमान सटीकता में सुधार के लिए एक धीमे शोधन मॉडल को सक्रिय करते हैं। मॉडल के व्यवहार को प्रस्तावित लक्ष्य के अनुकूल बनाने के लिए, हम कार्य निष्पादन से समझौता किए बिना आत्म-जागरूकता बढ़ाने के लिए एक हाइब्रिड लर्निंग पाइपलाइन का प्रस्ताव करते हैं। वार्तालाप स्थिति ट्रैकिंग कार्य पर मूल्यांकन परिणाम दर्शाते हैं कि ईकेबीएम अनिश्चितता-आधारित आधारभूत मॉडल की तुलना में बेहतर मॉडल विश्वसनीयता प्राप्त करता है। आगे के विश्लेषण से पता चलता है कि शोधन कम कम्प्यूटेशनल ओवरहेड को बनाए रखते हुए सटीकता में उल्लेखनीय रूप से सुधार करता है। यह फ्रेमवर्क त्रुटि-संवेदनशील अनुप्रयोगों में विश्वसनीय एलएलएम को तैनात करने के लिए एक स्केलेबल प्रतिमान स्थापित करके सटीकता और व्यावहारिकता को प्रभावी ढंग से संतुलित करता है।

Takeaways, Limitations

Takeaways:
हम एक नवीन ढांचा (ईकेबीएम) प्रस्तुत करते हैं जो एलएलएम की विश्वसनीयता और उपयोगिता में सुधार करने के लिए तीव्र और धीमी अनुमान प्रणालियों को जोड़ता है।
अनिश्चितता-आधारित आधारभूत मॉडल की तुलना में बेहतर विश्वसनीयता प्राप्त करना।
कम्प्यूटेशनल ओवरहेड को कम रखते हुए सटीकता में उल्लेखनीय सुधार होता है।
त्रुटि-संवेदनशील अनुप्रयोगों में विश्वसनीय LLM परिनियोजन के लिए एक मापनीय प्रतिमान प्रस्तुत करना।
Limitations:
प्रस्तावित ढांचे के सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।
विभिन्न प्रकार के एलएलएम और नौकरियों के लिए ईकेबीएम के प्रदर्शन का मूल्यांकन करने की आवश्यकता है।
हाइब्रिड लर्निंग पाइपलाइन के विस्तृत डिजाइन और अनुकूलन पर आगे अनुसंधान की आवश्यकता है।
👍