दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एलएलएम-संचालित रणनीतिक तर्ककर्ताओं में मानव-प्रेरित एजेंटिक परिष्कार का प्रभाव

Created by
  • Haebom

लेखक

विंस ट्रेंसेनी, एग्निज़्का मेन्सफेल्ट, कोस्टास स्टैथिस

रूपरेखा

यह शोधपत्र बड़े पैमाने के भाषा मॉडल (एलएलएम) के आधार पर, विशेष रूप से खेल-सिद्धांत संबंधी स्थितियों में, एजेंटों की रणनीतिक तर्क क्षमताओं का मूल्यांकन करता है। तीन एजेंट डिज़ाइन—एक सरल खेल-सिद्धांत संबंधी मॉडल, एक एलएलएम-केवल एजेंट, और एक पारंपरिक एजेंट ढाँचे में एकीकृत एलएलएम—का एक अनुमान लगाने वाले खेल में मूल्यांकन किया गया है और मानव प्रतिभागियों के साथ तुलना की गई है। प्रशिक्षण वितरण से परे सामान्यीकरण का आकलन अस्पष्ट खेल परिदृश्यों का उपयोग करके भी किया गया है। 25 एजेंट विन्यासों में 2,000 से अधिक अनुमान नमूनों का विश्लेषण करके, हम प्रदर्शित करते हैं कि मानव संज्ञानात्मक वास्तुकला की नकल करने वाले डिज़ाइन, मानव रणनीतिक व्यवहार के साथ एलएलएम एजेंटों की संगति में सुधार कर सकते हैं। हालाँकि, हम पाते हैं कि एजेंट डिज़ाइन की जटिलता और मानव-समानता के बीच संबंध अरैखिक है, जो अंतर्निहित एलएलएम के प्रदर्शन और सरल संरचनात्मक वृद्धि की सीमाओं पर बहुत अधिक निर्भर करता है।

Takeaways, Limitations

Takeaways: मानव संज्ञानात्मक संरचनाओं की नकल करने वाले डिज़ाइन मानव रणनीतिक व्यवहार के साथ एलएलएम एजेंटों की स्थिरता में सुधार करते हैं।
Takeaways: एजेंट डिज़ाइन जटिलता और मानव-समानता के बीच संबंध गैर-रैखिक है।
Limitations: एलएलएम एजेंट का प्रदर्शन अंतर्निहित एलएलएम की क्षमताओं पर बहुत अधिक निर्भर करता है।
Limitations: सरल संरचनात्मक वृद्धि की अपनी सीमाएँ हैं।
👍