Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

LLMs Can't Handle Peer Pressure: Crumbling under Multi-Agent Social Interactions

Created by
  • Haebom

저자

Maojia Song, Tej Deep Pala, Weisheng Jin, Amir Zadeh, Chuan Li, Dorien Herremans, Soujanya Poria

개요

본 논문은 다중 에이전트 시스템(MAS)에서 협업 지능의 구성 요소로 사용되는 대규모 언어 모델(LLM)의 신뢰 형성, 잘못된 정보 저항, 피어 입력 통합 능력을 분석합니다. 기존 연구에서 주로 집단사고에 초점을 맞춘 것과 달리, 본 논문은 복잡한 사회적 역동성 하에서 집단 지능 달성에 중요한 요소인 이러한 측면을 심층적으로 조사합니다. 이를 위해, 다양한 신뢰도를 가진 피어 에이전트와 함께 퀴즈 대회를 시뮬레이션하는 벤치마크 KAIROS를 제시하며, 전문가-초보자 역할, 노이즈가 많은 군중, 적대적 피어 등 다양한 조건을 미세하게 조정할 수 있습니다. LLM은 과거 상호 작용과 현재 피어 응답을 모두 받아 신뢰, 피어 행동, 자기 확신이 의사 결정에 미치는 영향을 체계적으로 조사합니다. 완화 전략으로 프롬프팅, 지도 학습 파인튜닝, 강화 학습(GRPO)을 여러 모델에서 평가하고, 그 결과 다중 에이전트 컨텍스트와 결과 기반 보상, 제약 없는 추론을 결합한 GRPO가 최고 성능을 달성하지만 기본 모델에 비해 사회적 영향에 대한 강건성은 감소함을 보여줍니다. 코드와 데이터셋은 공개되어 있습니다.

시사점, 한계점

시사점:
다중 에이전트 시스템에서 LLM의 신뢰 형성, 잘못된 정보 저항, 피어 입력 통합 메커니즘에 대한 심층적인 이해를 제공합니다.
다양한 조건을 제어할 수 있는 새로운 벤치마크 KAIROS를 제시합니다.
GRPO를 포함한 다양한 완화 전략의 효과를 평가하고, 최적의 전략을 제시합니다.
LLM 기반 다중 에이전트 시스템의 성능 향상을 위한 방향을 제시합니다.
한계점:
GRPO는 최고 성능을 달성하지만 사회적 영향에 대한 강건성이 감소합니다.
KAIROS 벤치마크의 일반화 가능성에 대한 추가 연구가 필요합니다.
실제 세계 시나리오에 대한 적용 가능성에 대한 추가 연구가 필요합니다.
👍