본 논문은 대규모 언어 모델(LLM)이 협력적 다중 에이전트 강화 학습(MARL) 환경에서 타인의 의도를 모델링하고 추론할 수 있는지, 즉 이른바 '마음 이론(Theory of Mind)'을 가지고 있는지를 조사합니다. LLM이 다양한 자연어 처리 과제에서 인상적인 제로샷 및 퓨샷 일반화 능력을 보이는데, 이는 단순히 대량의 텍스트 데이터만으로 훈련되었음에도 불구하고 텍스트 상호 작용의 의미를 추론하는 능력을 시사합니다. 본 연구는 LLM 기반 에이전트를 활용하여 인공 에이전트의 적응 및 협력 능력을 향상시키고, 인간과 인공 시스템 간의 원활한 협업을 가능하게 하는 하이브리드 인간-AI 시스템을 구축하는 것을 목표로 합니다. 이는 인간과 인공 시스템 간의 상호 작용의 미래에 대한 광범위한 시사점을 가지고 있습니다.