Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

LLM+MAP: Bimanual Robot Task Planning using Large Language Models and Planning Domain Definition Language

Created by
  • Haebom
Category
Empty

저자

Kun Chu, Xufeng Zhao, Cornelius Weber, Stefan Wermter

개요

본 논문은 양팔 로봇 조작의 복잡성, 특히 장기간에 걸친 작업 계획의 어려움을 해결하기 위해 LLM+MAP 프레임워크를 제시합니다. LLM+MAP은 대규모 언어 모델(LLM)의 추론 능력과 다중 에이전트 계획을 통합하여 효율적인 양팔 작업 계획을 자동화합니다. 기존의 LLM 기반 방법들이 장기간 추론 오류 및 환각에 취약한 점을 보완하고, GPT-4o를 백엔드로 사용하여 다양한 복잡성의 장기간 조작 작업에 대한 시뮬레이션 실험을 수행합니다. GPT-4o, GPT-3, o1, R1 등 다른 LLM과의 성능 비교를 통해 계획 시간, 성공률, 그룹 부채, 계획 단계 감소율 등의 지표를 분석하여 LLM+MAP의 우수성을 입증합니다. 소스 코드는 공개되어 있습니다.

시사점, 한계점

시사점:
LLM을 이용한 효율적인 양팔 로봇 작업 계획 자동화 가능성 제시
LLM의 장기간 추론 및 환각 문제를 다중 에이전트 계획과의 통합으로 해결
다양한 LLM과의 비교 실험을 통해 LLM+MAP의 우수성 검증
양팔 로봇 조작 분야에 대한 새로운 접근 방식 제시
공개된 소스 코드를 통한 재현성 및 확장성 확보
한계점:
현재는 시뮬레이션 환경에서만 실험 진행, 실제 로봇 환경에서의 성능 검증 필요
다양한 작업 유형에 대한 일반화 성능 평가 추가 필요
LLM의 성능에 의존적인 부분 존재, LLM의 한계가 LLM+MAP의 성능에 영향을 미칠 수 있음
복잡한 작업에 대한 계획의 최적화 및 효율성 향상 여지 존재
👍