Sign In

Experience-Driven Exploration for Efficient API-Free AI Agents

Created by
  • Haebom
Category
Empty

저자

Chenwei Tang, Jingyu Xing, Xinyu Liu, Zizhou Wang, Jiawei Du, Liangli Zhen, Jiancheng Lv

개요

KG-Agent는 API를 사용할 수 없는 환경에서 픽셀 기반 GUI를 통해 작동하는 에이전트를 위한 경험 기반 학습 프레임워크입니다. 이 프레임워크는 에이전트의 픽셀 수준 상호 작용을 지속적인 SA-KG(State-Action Knowledge Graph)로 구조화하여 효율성 문제를 해결합니다. KG-Agent는 시각적으로 다르지만 기능적으로 유사한 GUI 상태를 연결하여 비효율적인 탐색을 극복하고, 그래프 토폴로지를 기반으로 하는 하이브리드 내재적 보상 메커니즘을 통해 장기적인 추론을 지원합니다. Civilization V 및 Slay the Spire 환경에서 KG-Agent는 탐색 효율성과 전략적 깊이 측면에서 기존 방법보다 상당한 개선을 보였습니다.

시사점, 한계점

시사점:
API가 없는 환경에서 LLM 기반 에이전트의 효율성을 향상시키는 새로운 프레임워크 제시
SA-KG를 통해 에이전트의 경험을 구조화하여 일반화 및 효율적인 탐색을 가능하게 함
하이브리드 내재적 보상 메커니즘을 통해 장기적인 계획 및 보상 지연 문제 해결
Civilization V 및 Slay the Spire 환경에서 기존 방법보다 우수한 성능 입증
한계점:
논문에서 구체적인 한계점 언급 없음 (Abstract의 내용만으로는 파악 불가)
👍