Trajectory-Informed Memory Generation for Self-Improving Agent Systems

Created by

Haebom

저자

Gaodan Fang, Vatche Isahagian, K. R. Jayaram, Ritesh Kumar, Vinod Muthusamy, Punleuk Oum, Gegi Thomas

💡 개요

본 논문은 LLM 기반 에이전트가 실행 경험으로부터 학습하여 미래 성능을 개선하는 데 어려움을 겪는 문제를 해결하고자 합니다. 제안된 프레임워크는 에이전트 실행 궤적에서 행동 가능한 학습 내용을 자동으로 추출하고, 이를 통해 컨텍스트 기반 메모리 검색을 활용하여 미래 성능을 향상시킵니다. 실험 결과, AppWorld 벤치마크에서 최대 14.3%p의 시나리오 목표 달성률 향상을 보였으며, 특히 복잡한 작업에서 149%의 상대적 증가를 기록하며 상당한 개선 효과를 입증했습니다.

🔑 시사점 및 한계

•

LLM 에이전트가 단순히 과거 데이터를 저장하는 것을 넘어, 실행 궤적 분석을 통해 구체적이고 구조화된 학습 내용을 추출하고 이를 적극적으로 활용할 수 있음을 보여줍니다.

•

제안된 프레임워크는 실패 회복, 효율성 최적화 등 다양한 측면에서 에이전트의 성능을 체계적으로 개선할 수 있는 가능성을 제시합니다.

•

현재 연구는 AppWorld 벤치마크에 초점을 맞추고 있으며, 다양한 종류의 작업과 환경에서의 일반화 성능 및 새로운 유형의 오류나 학습에 대한 대응 능력에 대한 추가적인 연구가 필요합니다.

PDF 보기

Made with Slashpage