Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Tool-RoCo: An Agent-as-Tool Self-organization Large Language Model Benchmark in Multi-robot Cooperation

Created by
  • Haebom
Category
Empty

저자

Ke Zhang, Xiaoning Zhao, Ce Zheng, Jiahong Ning, Dandan Zhu, Wenqi Zhang, Chen Sun, Toshiharu Sugawara

Tool-RoCo: LLM 기반 장기적 멀티 에이전트 협업 벤치마크

개요

본 연구는 다중 로봇 협업 벤치마크인 RoCo를 기반으로, 대규모 언어 모델(LLM) 기반 장기적 멀티 에이전트 협업을 평가하기 위한 새로운 벤치마크인 Tool-RoCo를 제안합니다. Tool-RoCo는 에이전트 자율성을 무시하는 기존 LLM 기반 멀티 에이전트 시스템 연구의 한계를 극복하고자, 다른 에이전트를 도구로 취급하고 협력적 도구를 도입하여 도구 사용을 통해 멀티 에이전트 협업 및 자체 조직화를 평가합니다. 각 에이전트(LLM)는 현재 상태를 기반으로 후보 도구 세트에서 도구를 선택하고 피드백을 받은 후 후속 라운드에서 선택을 조정합니다. Tool-RoCo는 중앙 집중식 협업, 중앙 집중식 자체 조직화, 분산 협업, 자체 조직화의 네 가지 LLM 패러다임을 통해 다양한 자율성 수준을 평가합니다. SORT, PACK, CABINET의 세 가지 다중 로봇 작업을 포함하며, 도구 사용을 통해 형식 및 매개변수 정확도와 에이전트 조정을 측정합니다. 실험 결과, 협력적 도구 사용은 전체 도구의 7.09%에 불과했고, 활성화 도구는 96.42%를 차지하여 LLM 기반 에이전트가 다른 에이전트를 거의 지원자로 활용하지 않고, 대부분의 에이전트를 활성 상태로 유지하는 경향을 보였습니다.

시사점, 한계점

시사점:
LLM 기반 멀티 에이전트 시스템에서 에이전트 자율성 및 협업 능력을 평가하기 위한 체계적인 벤치마크 제공.
도구 사용을 통해 협업 및 자체 조직화를 평가하는 새로운 접근 방식 제시.
다양한 자율성 수준을 가진 LLM 패러다임(중앙 집중식, 분산형)을 도입하여 광범위한 평가 가능.
실험 결과, 현재 LLM 기반 에이전트가 협업 및 자체 조정 측면에서 개선의 여지가 있음을 시사.
한계점:
실험 결과, LLM 기반 에이전트가 협력적인 도구를 거의 사용하지 않고, 불필요한 에이전트를 활성 상태로 유지하는 경향을 보여, 현재 LLM의 협업 능력에 대한 한계 드러냄.
벤치마크에서 사용된 특정 작업(SORT, PACK, CABINET) 및 도구 세트의 일반화 가능성에 대한 추가 연구 필요.
제안된 LLM 패러다임 외 다른 자율성 모델 및 협력 전략에 대한 탐구 필요.
계산 비용 및 벤치마크 실행 시간 고려.
👍