Dejavu: Towards Experience Feedback Learning for Embodied Intelligence

Created by

Haebom

저자

Shaokai Wu, Yanbiao Ji, Qiuchang Li, Zhiyi Zhang, Qichen He, Wenyuan Xie, Guodong Zhang, Bayram Bayramli, Yue Ding, Hongtao Lu

💡 개요

본 논문은 실제 환경에 배포된 후 새로운 지식 습득에 어려움을 겪는 체화된 에이전트의 문제를 해결하기 위해 'Dejavu'라는 학습 프레임워크를 제안합니다. Dejavu는 고정된 Vision-Language-Action (VLA) 정책에 경험 피드백 네트워크(EFN)를 통해 과거 실행 기억을 검색하여 통합함으로써 성능을 향상시킵니다. EFN은 상황에 맞는 이전 행동 경험을 식별하고 검색된 정보를 바탕으로 행동 예측을 강화하며, 강화 학습과 의미론적 유사성 보상을 통해 훈련되어 에이전트가 경험으로부터 학습하는 능력을 보여줍니다.

🔑 시사점 및 한계

•

실시간 경험 기반 학습: 배포 후에도 에이전트가 지속적으로 새로운 경험을 학습하고 기존 정책을 보완할 수 있는 일반적인 프레임워크를 제시합니다.

•

견고성 및 적응성 향상: 다양한 체화된 작업에서 Dejavu는 고정된 정책 기반 에이전트보다 향상된 적응성, 견고성 및 성공률을 보여주어 실제 환경에서의 실용성을 입증합니다.

•

효율적인 메모리 활용 및 훈련: EFN은 상황에 맞는 과거 경험을 효율적으로 검색하고, 강화 학습을 통해 훈련되어 학습 과정의 복잡성을 줄이고 성능을 최적화합니다.

•

기억 관리 및 확장성의 복잡성: 경험을 지속적으로 축적함에 따라 효율적인 메모리 관리 및 검색 전략이 더욱 중요해지며, 대규모 경험 라이브러리에서의 확장성은 추가적인 연구가 필요합니다.

PDF 보기

Made with Slashpage