Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Communicating Plans, Not Percepts: Scalable Multi-Agent Coordination with Embodied World Models

Created by
  • Haebom

저자

Brennen A. Hill, Mant Koh En Wei, Thangavel Jishnuanandh

개요

본 논문은 부분 관찰 환경에서 다중 에이전트 시스템의 효과적인 의사 결정을 위한 강력한 조정을 탐구한다. 특히, 통신 프로토콜을 직접 엔지니어링할 것인지, 아니면 종단간 학습할 것인지에 대한 질문을 다룬다. 협력적인 작업 할당 문제에 대해 두 가지 통신 전략을 비교한다. 첫 번째는 LDC(Learned Direct Communication)로, 에이전트가 메시지와 액션을 동시에 생성하는 종단간 학습 방식이다. 두 번째는 ITGM(Imagined Trajectory Generation Module)이라는 콤팩트한 학습된 세계 모델을 사용하여 미래 상태를 시뮬레이션하고, 이를 요약하여 통신하는 의도 통신 방식이다. 그리드 월드 환경에서 목표 지향 상호 작용에 대한 실험을 통해, 단순한 환경에서는 LDC가 가능하지만, 복잡성이 증가함에 따라 세계 모델 기반 방식이 더 우수한 성능, 샘플 효율성 및 확장성을 보임을 확인했다.

시사점, 한계점

시사점:
구조화된 예측 모델을 MARL 에이전트에 통합하여 능동적이고 목표 지향적인 조정을 가능하게 할 수 있다.
엔지니어링된, 세계 모델 기반 접근 방식이 복잡성이 증가함에 따라 우수한 성능을 보인다.
한계점:
단순한 그리드 월드 환경에서의 실험만 수행되었다.
ITGM과 같은 세계 모델의 설계 및 학습에 대한 자세한 내용은 제시되지 않았다.
다른 복잡한 협업 작업에 대한 일반화 가능성에 대한 추가 연구가 필요하다.
👍