Explore with Long-term Memory: A Benchmark and Multimodal LLM-based Reinforcement Learning Framework for Embodied Exploration

Created by

Haebom

저자

Sen Wang, Bangwei Liu, Zhenkun Gao, Lizhuang Ma, Xuhong Wang, Yuan Xie, Xin Tan

💡 개요

본 논문은 장기적인 기억을 활용하여 복잡하고 긴 시간 범위의 임무를 수행할 수 있는 이상적인 체화된 에이전트를 만들기 위한 프레임워크와 벤치마크를 제안합니다. 기존 연구가 주로 임무 완수 결과에 집중했던 것과 달리, 에이전트의 탐색 과정과 기억 활용 능력을 통합하여 평생 학습을 촉진하는 LMEE(Long-term Memory Embodied Exploration)를 소개합니다. 또한, 다중 목표 탐색 및 기억 기반 질의응답을 포함하는 LMEE-Bench라는 새로운 데이터셋과 벤치마크를 구축하여 탐색 과정과 결과를 종합적으로 평가합니다.

🔑 시사점 및 한계

•

체화된 에이전트의 장기 기억 활용 능력과 능동적인 탐색을 강화하여 복잡하고 현실적인 환경에서의 지속적인 학습 및 임무 수행 가능성을 높입니다.

•

LMEE-Bench라는 새로운 벤치마크는 기존 연구에서 간과되었던 체화된 탐색의 과정과 기억 활용 능력을 평가하는 데 중요한 기준을 제공합니다.

•

제안된 MemoryExplorer 모델은 강화 학습을 통해 멀티모달 LLM을 미세 조정하여 능동적인 기억 질의 및 탐색을 유도하며, 장기 임무에서 뛰어난 성능을 보입니다.

•

향후 연구에서는 더 다양하고 복잡한 환경에서의 에이전트 성능 평가와 기억 처리 및 활용 메커니즘의 개선이 필요합니다.

PDF 보기

Made with Slashpage