Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Position: Theory of Mind Benchmarks are Broken for Large Language Models

Created by
  • Haebom

저자

Matthew Riemer, Zahra Ashktorab, Djallel Bouneffouf, Payel Das, Miao Liu, Justin D. Weisz, Murray Campbell

개요

본 논문은 대부분의 기존 사고 이론(Theory of Mind, ToM) 벤치마크가 LLMs(대규모 언어 모델)의 새로운 파트너에 대한 적응 능력을 직접적으로 평가하지 못하기 때문에 잘못되었다는 주장을 제기합니다. 기존 벤치마크는 인간의 사고 이론 평가 방식에서 영감을 얻어 AI 에이전트에게 인간과 같은 특성을 부여하려는 오류를 범합니다. 인간은 특정 상황에 대한 다양한 질문에 대해 일관된 추론 과정을 거치지만, 현재의 LLMs는 그렇지 않습니다. 기존 벤치마크는 주로 타인의 행동을 예측하는 능력인 '문자적 사고 이론(literal theory of mind)'만 측정하는데, 이는 에이전트가 자기 일관적인 추론을 보일 때만 유용합니다. 따라서 본 논문은 파트너의 행동에 대한 합리적인 반응에 따라 상황 내에서 에이전트에 적응하는 능력인 '기능적 사고 이론(functional theory of mind)' 개념을 제시합니다. 많은 오픈소스 LLMs는 강력한 문자적 사고 이론 능력을 보이지만, 매우 간단한 파트너 정책에서도 기능적 사고 이론에는 어려움을 겪는다는 것을 발견했습니다. 즉, 강력한 문자적 사고 이론 성능은 강력한 기능적 사고 이론 성능을 의미하지 않으며, 그 반대도 마찬가지입니다. 특히 파트너와의 장기적인 상호 작용에서 기능적 사고 이론을 달성하는 것은 LLM 사고 이론 평가에서 중요한 과제입니다.

시사점, 한계점

시사점: 기존 ToM 벤치마크의 한계를 지적하고, LLM의 사고 이론 평가를 위한 새로운 척도인 '기능적 사고 이론'을 제시함으로써 LLM의 ToM 능력 평가에 대한 새로운 방향을 제시합니다. LLM의 문자적 사고 이론과 기능적 사고 이론 간의 차이를 강조하여, 단순한 예측 능력을 넘어 적응력과 상호작용 능력을 고려해야 함을 시사합니다.
한계점: 기능적 사고 이론의 정의 및 측정 방법에 대한 보다 명확한 지침과 구체적인 벤치마크 개발이 필요합니다. 제안된 기능적 사고 이론의 개념이 모든 유형의 LLM 및 상호 작용에 적용 가능한지에 대한 추가 연구가 필요합니다. 또한, 장기적인 상호 작용에서 기능적 사고 이론을 평가하는 데 필요한 계산 자원 및 시간이 상당할 수 있습니다.
👍