Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

WebCoach: Self-Evolving Web Agents with Cross-Session Memory Guidance

Created by
  • Haebom
Category
Empty

저자

Genglin Liu, Shijie Geng, Sha Li, Hejie Cui, Sarah Zhang, Xin Liu, Tianyi Liu

개요

WebCoach는 웹 브라우징 에이전트가 장기적인 계획, 반성, 지속적인 학습을 가능하게 하는 모델에 독립적인 자기 진화 프레임워크입니다. WebCoach는 웹 탐색 로그를 요약하는 WebCondenser, 완전한 궤적을 에피소드 경험으로 정리하는 External Memory Store, 유사성 및 최근성에 따라 관련 경험을 검색하고 런타임 훅을 통해 에이전트에 작업별 조언을 주입할지 결정하는 Coach의 세 가지 주요 구성 요소로 구성됩니다. WebCoach는 복잡한 브라우징 작업에서 견고성을 향상시키고 재훈련 없이도 새로운 탐색 궤적에서 에피소드 메모리를 지속적으로 큐레이션하여 자기 진화를 달성합니다. WebVoyager 벤치마크에서 38B 모델의 작업 성공률을 47%에서 61%로 향상시켰으며, GPT-4o를 사용하는 웹 에이전트와 동등한 성능을 달성했습니다.

시사점, 한계점

시사점:
장기 기억을 통해 웹 브라우징 에이전트의 성능을 향상시킴.
지속적인 학습을 통해 에이전트의 자기 진화를 가능하게 함.
다양한 LLM 백본에서 일관된 성능 향상을 보임.
작은 모델에서도 GPT-4o와 유사한 성능을 달성함.
한계점:
논문에서 구체적인 한계점은 명시되지 않음.
👍