Self-Abstraction from Grounded Experience for Plan-Guided Policy Refinement
Created by
Haebom
Category
Empty
저자
Hiroaki Hayashi, Bo Pang, Wenting Zhao, Ye Liu, Akash Gokul, Srijan Bansal, Caiming Xiong, Semih Yavuz, Yingbo Zhou
개요
SAGE는 LLM 기반 에이전트가 자체 실행을 통해 학습하고, 자체 추상화를 통해 동작을 개선할 수 있도록 하는 프레임워크입니다. 초기 실행 후, 에이전트는 경험으로부터 핵심 단계, 종속성 및 제약 조건을 추출하여 간결한 계획 추상화를 유도합니다. 이 학습된 추상화는 이후 실행에 대한 컨텍스트 지침으로 활용되어 에이전트의 정책을 개선하고 보다 구조화되고 정보에 입각한 실행을 지원합니다.
시사점, 한계점
•
SAGE는 다양한 LLM 백본 및 에이전트 아키텍처에서 일관된 성능 향상을 제공합니다.
•
GPT-5 (high) 백본과 결합된 Mini-SWE-Agent 대비 7.2%의 상대적 성능 향상을 보였습니다.