यह शोधपत्र बड़े पैमाने के भाषा मॉडल (एलएलएम) के आधार पर, विशेष रूप से खेल-सिद्धांत संबंधी स्थितियों में, एजेंटों की रणनीतिक तर्क क्षमताओं का मूल्यांकन करता है। तीन एजेंट डिज़ाइन—एक सरल खेल-सिद्धांत संबंधी मॉडल, एक एलएलएम-केवल एजेंट, और एक पारंपरिक एजेंट ढाँचे में एकीकृत एलएलएम—का एक अनुमान लगाने वाले खेल में मूल्यांकन किया गया है और मानव प्रतिभागियों के साथ तुलना की गई है। प्रशिक्षण वितरण से परे सामान्यीकरण का आकलन अस्पष्ट खेल परिदृश्यों का उपयोग करके भी किया गया है। 25 एजेंट विन्यासों में 2,000 से अधिक अनुमान नमूनों का विश्लेषण करके, हम प्रदर्शित करते हैं कि मानव संज्ञानात्मक वास्तुकला की नकल करने वाले डिज़ाइन, मानव रणनीतिक व्यवहार के साथ एलएलएम एजेंटों की संगति में सुधार कर सकते हैं। हालाँकि, हम पाते हैं कि एजेंट डिज़ाइन की जटिलता और मानव-समानता के बीच संबंध अरैखिक है, जो अंतर्निहित एलएलएम के प्रदर्शन और सरल संरचनात्मक वृद्धि की सीमाओं पर बहुत अधिक निर्भर करता है।