Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Agent Learning via Early Experience

Created by
  • Haebom

저자

Kai Zhang, Xiangchao Chen, Bo Liu, Tianci Xue, Zeyi Liao, Zhihan Liu, Xiyao Wang, Yuting Ning, Zhaorun Chen, Xiaohan Fu, Jian Xie, Yuxuan Sun, Boyu Gou, Qi Qi, Zihang Meng, Jianwei Yang, Ning Zhang, Xian Li, Ashish Shah, Dat Huynh, Hengduo Li, Zi Yang, Sara Cao, Lawrence Jang, Shuyan Zhou, Jiacheng Zhu, Huan Sun, Jason Weston, Yu Su, Yifan Wu

개요

언어 에이전트가 자체 경험을 통해 학습하고 개선하여 복잡한 실제 작업에서 인간을 능가하는 것을 목표로 한다. 본 논문은 검증 가능한 보상이 부족하거나 비효율적인 장기 롤아웃이 필요한 환경에서 강화 학습을 통한 훈련의 어려움을 해결하고자 한다. 이를 위해, 전문가 데이터에 대한 지도 학습의 한계를 극복하기 위해, 에이전트의 자체 행동으로 생성된 상호작용 데이터인 "초기 경험"을 활용하는 방식을 제안한다. 이 "초기 경험"을 활용하는 두 가지 전략 (1) 암묵적 세계 모델링과 (2) 자기 성찰을 연구하고, 다양한 환경에서 효과와 일반화 성능을 입증한다.

시사점, 한계점

시사점:
"초기 경험"은 에이전트의 효과 및 out-of-domain 일반화 성능을 향상시킨다.
"초기 경험"은 모방 학습과 완전한 경험 기반 에이전트 사이의 가교 역할을 할 수 있다.
한계점:
논문에서 구체적인 한계점은 명시되지 않음.
👍