दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

बड़े भाषा मॉडल में मतिभ्रम नियंत्रण की मौलिक असंभवता पर

Created by
  • Haebom

लेखक

मीका पी. कार्पोविच

रूपरेखा

यह शोधपत्र सिद्ध करता है कि वृहत्-स्तरीय भाषा मॉडलों (एलएलएम) में मतिभ्रम पर पूर्ण नियंत्रण गणितीय रूप से असंभव है। कोई भी एलएलएम अनुमान तंत्र एक साथ सत्य प्रतिक्रिया निर्माण, अर्थगत सूचना संरक्षण, प्रासंगिक ज्ञान प्रकटीकरण और ज्ञान प्रतिबंध अनुकूलन प्राप्त नहीं कर सकता। यह असंभवता कोई अभियांत्रिकी सीमा नहीं है, बल्कि सूचना एकत्रीकरण की गणितीय संरचना से उत्पन्न एक मूलभूत समस्या है। तीन गणितीय ढाँचों—नीलामी सिद्धांत, संभाव्यता पूर्वानुमान के लिए उपयुक्त अंक सिद्धांत, और ट्रांसफ़ॉर्मर आर्किटेक्चर के लिए लघुगणक-योग घातांकीय विश्लेषण—का उपयोग करके, हम दर्शाते हैं कि सूचना एकत्रीकरण अनिवार्य रूप से संरक्षण सिद्धांत का उल्लंघन करता है। ट्रांसफ़ॉर्मर संभाव्यता एकत्रीकरण का जेन्सन अंतराल इस असंभवता का प्रत्यक्ष माप है। ये परिणाम मतिभ्रम को वितरित बुद्धिमत्ता की एक अपरिहार्य गणितीय विशेषता के रूप में पुनर्परिभाषित करते हैं, न कि एक अभियांत्रिकी त्रुटि के रूप में। सत्यता, ज्ञान उपयोग और प्रतिक्रिया पूर्णता के बीच एक मूलभूत समझौता है, और ये मतिभ्रमों को समाप्त करने के बजाय उनके प्रबंधन के लिए एक सैद्धांतिक आधार प्रदान करते हैं। यह अध्ययन तंत्रिका नेटवर्क अनुमान, ज्ञान और अनुमान के दर्शन, खेल सिद्धांत और सूचना सिद्धांत में शास्त्रीय परिणामों के बीच गहरे संबंधों को उजागर करता है, और गणितीय बाधाओं के भीतर लाभकारी एआई प्रणालियों को विकसित करने के लिए नए अनुसंधान दिशाओं का सुझाव देता है।

Takeaways, Limitations

Takeaways:
एलएलएम मतिभ्रम की समस्या की मौलिक समझ प्रदान करता है, यह बताकर कि मतिभ्रम एक गणितीय रूप से अपरिहार्य घटना है, न कि एक इंजीनियरिंग समस्या।
सत्यनिष्ठा, ज्ञान उपयोग और प्रतिक्रिया पूर्णता के बीच के अंतर को स्पष्ट करके, हम मतिभ्रम प्रबंधन रणनीतियों को विकसित करने के लिए एक सैद्धांतिक आधार प्रदान करते हैं।
यह तंत्रिका नेटवर्क अनुमान, दर्शन, खेल सिद्धांत और सूचना सिद्धांत जैसे विभिन्न क्षेत्रों को जोड़कर एआई अनुसंधान के लिए एक नई दिशा का सुझाव देता है।
Limitations:
यह शोधपत्र मतिभ्रम को पूरी तरह से समाप्त करने की गणितीय असंभवता को सिद्ध करता है, लेकिन उन्हें प्रभावी ढंग से प्रबंधित करने के लिए कोई विशिष्ट पद्धति प्रस्तुत नहीं करता है ।
प्रमाण में प्रयुक्त गणितीय ढांचा जटिल है और सामान्य एआई शोधकर्ताओं के लिए इसे समझना कठिन हो सकता है।
ऐसा सामान्य गणितीय मॉडल प्रस्तुत करना संभव नहीं है जो वास्तविक एलएलएम की भ्रामक घटनाओं को पूरी तरह से समाहित कर सके।
👍