Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Self-Abstraction from Grounded Experience for Plan-Guided Policy Refinement

Created by
  • Haebom
Category
Empty

저자

Hiroaki Hayashi, Bo Pang, Wenting Zhao, Ye Liu, Akash Gokul, Srijan Bansal, Caiming Xiong, Semih Yavuz, Yingbo Zhou

개요

SAGE는 LLM 기반 에이전트가 자체 실행을 통해 학습하고, 자체 추상화를 통해 동작을 개선할 수 있도록 하는 프레임워크입니다. 초기 실행 후, 에이전트는 경험으로부터 핵심 단계, 종속성 및 제약 조건을 추출하여 간결한 계획 추상화를 유도합니다. 이 학습된 추상화는 이후 실행에 대한 컨텍스트 지침으로 활용되어 에이전트의 정책을 개선하고 보다 구조화되고 정보에 입각한 실행을 지원합니다.

시사점, 한계점

SAGE는 다양한 LLM 백본 및 에이전트 아키텍처에서 일관된 성능 향상을 제공합니다.
GPT-5 (high) 백본과 결합된 Mini-SWE-Agent 대비 7.2%의 상대적 성능 향상을 보였습니다.
SWE-Bench Verified 벤치마크에서 높은 Pass@1 resolve rates (Mini-SWE-Agent: 73.2%, OpenHands CodeAct: 74%)를 달성했습니다.
논문에서 한계점은 명시적으로 언급되지 않았습니다.
👍