Sign In

AgentFold: Long-Horizon Web Agents with Proactive Context Management

Created by
  • Haebom
Category
Empty

저자

Rui Ye, Zhongwang Zhang, Kuan Li, Huifeng Yin, Zhengwei Tao, Yida Zhao, Liangcai Su, Liwen Zhang, Zile Qiao, Xinyu Wang, Pengjun Xie, Fei Huang, Siheng Chen, Jingren Zhou, Yong Jiang

AgentFold: Retrospective Consolidation for LLM Agents

개요

LLM 기반 웹 에이전트의 긴 호라이즌 작업에서의 맥락 관리의 근본적인 트레이드오프 문제를 해결하기 위해, AgentFold를 제안한다. AgentFold는 수동적인 로그가 아닌, 적극적으로 조형되는 동적 인지 작업 공간으로 맥락을 취급한다. 각 단계에서 세밀한 디테일을 보존하는 세분화된 압축 또는 전체 다단계 하위 작업을 추상화하는 깊은 통합을 수행하는 '폴딩' 작업을 학습한다. AgentFold-30B-A3B는 BrowseComp에서 36.2%, BrowseComp-ZH에서 47.3%의 성능을 달성하여, DeepSeek-V3.1-671B-A37B와 같은 대규모 오픈 소스 모델을 능가하며 OpenAI의 o4-mini와 같은 선도적인 독점 에이전트보다 뛰어난 성능을 보였다.

시사점, 한계점

시사점:
새로운 에이전트 패러다임인 AgentFold를 통해 긴 호라이즌 작업에서 LLM 기반 웹 에이전트의 성능을 향상시켰다.
단순한 지도 학습만으로도 대규모 모델을 능가하는 성능을 달성했다.
프로그래밍된 툴 사용 없이 자체적으로 툴 사용을 계획, 사용, 추론, 행동 할 수 있는 능력을 보여주었다.
AgentFold는 맥락 관리를 위한 혁신적인 접근 방식을 제시하여, 에이전트 연구 분야에 기여했다.
한계점:
논문의 구체적인 한계점은 제시되지 않음. (논문 내용 요약에 포함되지 않음)
👍