Sign In

AutoMisty: A Multi-Agent LLM Framework for Automated Code Generation in the Misty Social Robot

Created by
  • Haebom
Category
Empty

저자

Xiao Wang, Lu Dong, Sahana Rangasrinivasan, Ifeoma Nwogu, Srirangaraj Setlur, Venugopal Govindaraju

개요

본 논문은 프로그래밍 경험이 없는 사용자도 자연어 명령어를 통해 Misty 로봇을 제어할 수 있도록 하는 다중 에이전트 협업 프레임워크인 AutoMisty를 제시한다. AutoMisty는 대규모 언어 모델(LLM)을 기반으로 하며, 작업 분해, 할당, 문제 해결, 결과 종합을 담당하는 네 가지 특수 에이전트 모듈로 구성된다. 각 에이전트는 반복적인 개선을 위한 자기 반성과 사용자 선호도와의 정렬을 위한 사람-컴퓨터 상호작용(Human-in-the-loop)을 포함하는 2단계 최적화 메커니즘을 통합한다. AutoMisty는 투명한 추론 과정을 보장하여 사용자가 자연어 피드백을 통해 작업을 반복적으로 개선하고 정확한 실행을 가능하게 한다. 4가지 복잡성 수준의 벤치마크 작업 세트를 설계하고 실제 Misty 로봇 환경에서 실험을 수행하여 AutoMisty의 효과를 평가했으며, ChatGPT-4o 및 ChatGPT-o1을 이용한 직접 추론보다 훨씬 우수한 성능을 보였다고 보고한다. 모든 코드, 최적화된 API 및 실험 비디오는 웹페이지(https://wangxiaoshawn.github.io/AutoMisty.html)를 통해 공개될 예정이다.

시사점, 한계점

시사점:
자연어 기반 로봇 제어를 통해 프로그래밍 지식이 없는 사용자도 소셜 로봇을 활용할 수 있도록 함.
다중 에이전트 협업 및 2단계 최적화 메커니즘을 통해 고품질 코드 생성 및 정확한 코드 제어 가능.
투명한 추론 과정과 사람-컴퓨터 상호작용을 통해 사용자 피드백을 효과적으로 반영.
ChatGPT 기반의 직접 추론 방식보다 우수한 성능을 입증.
코드, API, 실험 비디오 공개를 통한 연구의 재현성 및 확장성 확보.
한계점:
AutoMisty의 성능 평가가 특정 로봇 플랫폼(Misty)과 제한된 작업 세트에 국한됨.
실제 세계의 다양한 상황과 복잡한 작업에 대한 일반화 가능성에 대한 추가 연구 필요.
자연어 이해의 한계로 인한 오류 발생 가능성.
다양한 로봇 플랫폼 및 작업에 대한 적용 가능성 검증 필요.
👍