दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

भाषा मॉडलों के लिए एकीकृत संज्ञानात्मक चेतना सिद्धांत: एंकरिंग शब्दार्थ, सक्रियण की दहलीजें, और उभरती हुई तर्कशक्ति

작성자
  • Haebom

लेखक

एडवर्ड वाई चांग, ज़ेनेब एन काया, एथन चांग

रूपरेखा

चेतना का एकीकृत संज्ञानात्मक सिद्धांत (यूसीसीटी) बड़े पैमाने के भाषा मॉडलों (एलएलएम) की बुद्धिमत्ता को आंतरिक रूप से नहीं, बल्कि पैटर्नों के एक विशाल, अचेतन भंडार के रूप में देखता है। अनुमान केवल तभी होता है जब बाहरी एंकरिंग तंत्र (जैसे कुछ-शॉट संकेत, पुनर्प्राप्ति-संवर्धित संदर्भ, फ़ाइन-ट्यूनिंग, या बहु-एजेंट तर्क) कार्य-प्रासंगिक पैटर्न को सक्रिय करते हैं। यूसीसीटी इस प्रक्रिया को पूर्व-प्रशिक्षण के दौरान सीखे गए सांख्यिकीय पूर्वानुमेय और संदर्भ-आधारित लक्ष्य पैटर्न के बीच एक बायेसियन प्रतियोगिता के रूप में औपचारिक रूप देता है, एक एकल मात्रात्मक व्याख्या प्रदान करता है जो मौजूदा अनुकूली तकनीकों को एकीकृत करता है। यह तीन सिद्धांतों (थ्रेशोल्ड ओवरशूट, मोडैलिटी यूनिवर्सलिटी, और घनत्व-दूरी भविष्यसूचक शक्ति) पर आधारित है और इसे टेक्स्ट क्यूए, इमेज कैप्शन जनरेशन, और बहु-एजेंट तर्क में क्रॉस-डोमेन प्रदर्शनों के साथ-साथ संख्यात्मक मॉडल (आधार 8, 9, और 10) और परत-दर-परत पथ विश्लेषण का उपयोग करके गहन प्रयोगों के माध्यम से मान्य किया गया है। प्रायोगिक परिणाम थ्रेशोल्ड व्यवहार, असममित व्यतिकरण और स्मृति हिस्टैरिसीस का प्रदर्शन करके यूसीसीटी की भविष्यवाणियों का समर्थन करते हैं। यह प्रदर्शित करके कि एलएलएम की "बुद्धिमत्ता" मॉडल में अंतर्निहित नहीं है, बल्कि सिमेंटिक एंकरिंग के माध्यम से उत्पन्न होती है, यूसीसीटी व्याख्यात्मक निदान और संकेतों, मॉडल चयन और संरेखण-संचालित प्रणाली डिज़ाइन के लिए व्यावहारिक मार्गदर्शन प्रदान करता है।

Takeaways, Limitations

Takeaways:
एलएलएम में बुद्धिमत्ता के लिए एक नया सैद्धांतिक ढांचा (यूसीसीटी) प्रस्तुत करना
त्वरित इंजीनियरिंग, मॉडल चयन और संरेखण-संचालित प्रणाली डिजाइन पर व्यावहारिक मार्गदर्शन प्रदान करता है।
एलएलएम की व्याख्यात्मकता में सुधार करने में योगदान
एक एकल मात्रात्मक स्पष्टीकरण प्रदान करता है जो मौजूदा अनुकूली प्रौद्योगिकियों को एकीकृत करता है।
विभिन्न प्रयोगों के माध्यम से सिद्धांत का सत्यापन
Limitations:
यूसीसीटी की व्यापकता और दायरे पर आगे शोध की आवश्यकता है।
प्रस्तुत प्रयोग का दायरा सीमित हो सकता है।
अधिक जटिल एलएलएम आर्किटेक्चर के लिए प्रयोज्यता सत्यापन की आवश्यकता है।
वास्तविक दुनिया के अनुप्रयोगों में आगे के प्रदर्शन मूल्यांकन की आवश्यकता है।
👍