Don't Just Follow MLLM Plans: Robust and Efficient Planning for Open-world Agents
Created by
Haebom
저자
Seungjoon Lee, Suhwan Kim, Minhyeon Oh, Youngsik Yoon, Jungseul Ok
개요
본 논문은 예측 불가능하고 상호 작용하는 환경에서 복잡한 다단계 작업을 수행할 수 있는 자율 에이전트 개발의 어려움을 다룹니다. 기존의 대규모 언어 모델(LLM) 기반 접근 방식은 내부 지식의 문제점이나 비현실적인 환경 가정에 의존하는 한계를 지니고 있습니다. 따라서 본 논문에서는 현실적인 환경에서 처음부터 계획 지식을 습득하는 에이전트를 개발하는 새로운 프레임워크인 REPOA(Robust and Efficient Planning for Open-world Agents)를 제시합니다. REPOA는 지식 부정확성에 대한 강건성을 높이기 위해 적응적 의존성 학습 및 세분화된 실패 인식 연산 메모리를 사용하고, 학습 효율을 개선하기 위해 난이도 기반 탐색을 특징으로 합니다. 두 개의 기존 오픈월드 테스트베드에서의 평가를 통해 REPOA의 강력하고 효율적인 계획 능력과 기존 접근 방식으로는 달성할 수 없었던 어려운 후반 게임 아이템을 성공적으로 획득하는 능력을 보여줍니다.
시사점, 한계점
•
시사점:
◦
LLM의 부정확한 지식에 대한 강건성을 확보하면서 복잡한 다단계 작업을 수행하는 자율 에이전트 개발에 새로운 가능성을 제시합니다.
◦
적응적 의존성 학습과 난이도 기반 탐색을 통해 학습 효율을 크게 향상시킬 수 있음을 보여줍니다.
◦
기존 접근 방식으로는 불가능했던 어려운 작업을 성공적으로 수행하는 능력을 실험적으로 증명합니다.
•
한계점:
◦
제시된 프레임워크의 일반화 성능 및 다양한 환경에 대한 적용 가능성에 대한 추가 연구가 필요합니다.
◦
현재 평가는 두 개의 특정 오픈월드 테스트베드에 국한되어 있으며, 더욱 광범위한 환경에서의 성능 검증이 필요합니다.