CaPo: Cooperative Plan Optimization for Efficient Embodied Multi-Agent Cooperation
Created by
Haebom
Category
Empty
저자
Jie Liu, Pan Zhou, Yingjun Du, Ah-Hwee Tan, Cees G. M. Snoek, Jan-Jakob Sonke, Efstratios Gavves
개요
본 논문은 대규모 언어 모델(LLM) 기반 물리적 에이전트 간의 협력 문제를 해결하기 위해 협력 계획 최적화(CaPo) 방법을 제안합니다. 기존 방법들이 장기적인 전략적이고 협력적인 계획 없이 임시적이고 비체계적으로 행동하여 중복된 단계, 실패, 심각한 결과를 초래하는 문제점을 해결하고자 합니다. CaPo는 인간의 협력 방식에서 영감을 받아 메타 계획 생성 및 진행 상황 적응형 메타 계획 및 실행의 두 단계로 구성됩니다. 첫 번째 단계에서는 모든 에이전트가 과제를 분석하고 논의하여 과제를 세부 단계가 포함된 하위 과제로 분해하는 메타 계획을 협력적으로 생성하여 효율적인 조정을 위한 장기적인 전략적이고 일관된 계획을 보장합니다. 두 번째 단계에서는 에이전트가 메타 계획에 따라 작업을 실행하고 여러 차례의 논의를 통해 최신 진행 상황(예: 목표 객체 발견)에 따라 동적으로 조정합니다. 이러한 진행 상황 기반 적응을 통해 중복된 작업을 제거하고 에이전트의 전반적인 협력 효율성을 향상시킵니다. ThreeDworld 다중 에이전트 운송 및 의사소통 관찰 및 지원 작업에 대한 실험 결과는 CaPo가 최첨단 기술에 비해 훨씬 높은 작업 완료율과 효율성을 달성함을 보여줍니다. 코드는 https://github.com/jliu4ai/CaPo 에서 공개됩니다.