Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ICCO: Learning an Instruction-conditioned Coordinator for Language-guided Task-aligned Multi-robot Control

Created by
  • Haebom
Category
Empty

저자

Yoshiki Yano, Kazuki Shibata, Maarten Kokshoorn, Takamitsu Matsubara

개요

본 논문은 대규모 언어 모델(LLM) 기반의 언어 유도 다중 로봇 시스템에서 효과적인 협업을 달성하기 위한 새로운 다중 에이전트 강화 학습(MARL) 프레임워크인 Instruction-Conditioned Coordinator (ICCO)를 제안한다. ICCO는 조정자 에이전트와 여러 지역 에이전트로 구성되며, 조정자는 언어 명령어와 환경 상태를 통합하여 작업과 일치하고 일관된 명령어(TACI)를 생성하여 작업 정렬과 행동 일관성을 보장한다. 조정자와 지역 에이전트는 작업 효율성과 명령어 준수를 조정하는 보상 함수를 최적화하도록 공동으로 훈련된다. 학습 목표에는 일관성 향상 항이 추가되어 명령어와 로봇 행동 간의 상호 정보를 극대화하여 협업을 더욱 향상시킨다. 시뮬레이션 및 실제 세계 실험을 통해 ICCO의 효과를 검증하였다.

시사점, 한계점

시사점:
LLM을 활용한 언어 유도 다중 로봇 시스템의 협업 문제 해결에 대한 새로운 접근 방식 제시.
작업 정렬 및 행동 일관성을 보장하는 TACI 생성을 통한 효율적인 다중 로봇 제어 가능성 입증.
MARL 기반의 조정자-지역 에이전트 구조를 통해 향상된 협업 성능 달성.
시뮬레이션과 실제 세계 실험을 통한 ICCO의 효과성 검증.
한계점:
제안된 방법의 확장성에 대한 추가적인 연구 필요 (로봇 수 증가에 대한 성능 저하 가능성).
복잡하고 예측 불가능한 환경에서의 로버스트니스에 대한 추가적인 검증 필요.
다양한 유형의 작업 및 언어 명령어에 대한 일반화 성능 평가 필요.
👍