본 논문은 대규모 언어 모델(LLM)의 추론 능력이 사회적 지능, 특히 협력적 상황에서의 의사결정 능력으로 확장되는지 여부를 경제 게임을 통해 조사합니다. 연구는 공공재 게임에서 GPT-4에 사고연쇄 및 반성 프롬프트를 적용하고, 6가지 협력 및 처벌 게임에서 다양한 LLM을 평가하여 추론 메커니즘의 유무에 따른 차이를 비교 분석합니다. 그 결과, 추론 모델은 개인적 이익을 우선시하여 협력과 규범 강화를 감소시키는 것으로 나타났으며, 반복적인 상호작용에서 추론 모델이 많은 그룹은 집단적 이익이 더 낮았습니다. 이러한 결과는 인간의 "자발적 기부와 계산된 탐욕" 패턴을 반영합니다.