본 논문은 대규모 언어 모델(LLM)을 다중 에이전트 강화 학습(MARL)에 통합하여 시뮬레이션 게임 환경에서 조정, 통신 및 일반화를 향상시키는 통합 프레임워크인 LLM-MARL을 소개합니다. 이 프레임워크는 Coordinator, Communicator, Memory의 세 가지 모듈식 구성 요소를 특징으로 하며, 하위 목표를 동적으로 생성하고, 에이전트 간의 기호 메시징을 용이하게 하며, 에피소드 회상을 지원합니다. 훈련은 PPO와 언어 조건 손실 및 LLM 쿼리 게이팅을 결합합니다. LLM-MARL은 Google Research Football, MAgent Battle, StarCraft II에서 평가되었습니다.