Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

How Far Can LLMs Emulate Human Behavior?: A Strategic Analysis via the Buy-and-Sell Negotiation Game

Created by
  • Haebom
Category
Empty

저자

Mingyu Jeon, Jaeyoung Suh, Suwan Cho, Dohyeon Kim

개요

대규모 언어 모델(LLM)의 발전과 함께, 본 연구는 LLM이 단순한 질문-응답을 넘어 인간과 유사한 대화 능력과 행동 모방 능력을 얼마나 잘 수행할 수 있는지에 주목한다. 특히, LLM이 실제 인간의 감정과 행동을 얼마나 정확하게 재현하고, 이러한 재현이 실제 시나리오에서 효과적으로 작동할 수 있는지에 대한 관심이 높다. 기존 벤치마크는 지식 기반 평가에 초점을 맞춰 사회적 상호작용 및 전략적 대화 능력을 충분히 반영하지 못한다는 한계를 해결하기 위해, 본 연구는 구매 및 판매 협상 시뮬레이션을 활용하여 LLM의 인간 감정 및 행동 모방, 전략적 의사 결정 능력을 정량적으로 평가하는 방법론을 제시한다. 여러 LLM에 다양한 페르소나를 할당하고 구매자와 판매자 간 협상을 진행하여 승률, 거래 가격, SHAP 값과 같은 결과를 종합적으로 분석한다.

시사점, 한계점

시사점:
기존 벤치마크 점수가 높은 모델이 전반적으로 더 나은 협상 성과를 보였다.
감정적 또는 사회적 맥락을 강조하는 시나리오에서는 일부 모델의 성능이 저하되었다.
경쟁적이고 교활한 특성이 이타적이고 협력적인 특성보다 협상 결과에 유리하게 작용했다.
할당된 페르소나가 협상 전략과 결과에 큰 영향을 미칠 수 있음을 시사한다.
LLM의 사회적 행동 모방 및 대화 전략에 대한 새로운 평가 접근 방식을 제시했다.
협상 시뮬레이션이 실제 상호작용 능력을 측정하는 의미 있는 보완적 지표로 활용될 수 있음을 보여주었다.
한계점:
(논문 내용에 명시된 한계점은 없음)
👍