본 연구는 비즈니스 협상과 그룹 협업과 같은 다양한 인간 활동에 LLM이 활용됨에 따라, LLM의 성능 향상과 동적, 다중 에이전트 환경에서의 상호 작용을 평가하는 것이 중요하다고 강조한다. LLM은 잘 정의된 환경에서 뛰어난 성능을 보이는 기존의 통계적 에이전트와 달리, 다양한 실제 시나리오에서 일반화할 수 있다. 본 연구는 인간(N=216), LLM(GPT-4o, Gemini 1.5 Pro), 베이지안 에이전트 간의 동적 협상 환경에서의 결과와 행동 역학을 비교 분석한다. 베이지안 에이전트는 공격적인 최적화를 통해 높은 잉여 가치를 창출하지만, 빈번한 거래 거부라는 단점이 있다. 인간과 LLM은 유사한 전체 잉여 가치를 달성하지만, LLM은 보수적이고 양보적인 거래를 선호하며, 인간은 보다 전략적이고 위험을 감수하며 공정성을 추구하는 행동을 보인다. 따라서, 성능 동등성은 프로세스 및 정렬의 근본적인 차이점을 숨길 수 있으며, 이는 실제 협업 작업에 LLM을 적용하는 데 중요하다. 본 연구는 일치된 조건에서 기본적인 행동 기준선을 설정하여 향후 연구의 토대를 마련한다.