KG-Agent는 API를 사용할 수 없는 환경에서 픽셀 기반 GUI를 통해 작동하는 에이전트를 위한 경험 기반 학습 프레임워크입니다. 이 프레임워크는 에이전트의 픽셀 수준 상호 작용을 지속적인 SA-KG(State-Action Knowledge Graph)로 구조화하여 효율성 문제를 해결합니다. KG-Agent는 시각적으로 다르지만 기능적으로 유사한 GUI 상태를 연결하여 비효율적인 탐색을 극복하고, 그래프 토폴로지를 기반으로 하는 하이브리드 내재적 보상 메커니즘을 통해 장기적인 추론을 지원합니다. Civilization V 및 Slay the Spire 환경에서 KG-Agent는 탐색 효율성과 전략적 깊이 측면에서 기존 방법보다 상당한 개선을 보였습니다.
시사점, 한계점
•
시사점:
◦
API가 없는 환경에서 LLM 기반 에이전트의 효율성을 향상시키는 새로운 프레임워크 제시
◦
SA-KG를 통해 에이전트의 경험을 구조화하여 일반화 및 효율적인 탐색을 가능하게 함
◦
하이브리드 내재적 보상 메커니즘을 통해 장기적인 계획 및 보상 지연 문제 해결
◦
Civilization V 및 Slay the Spire 환경에서 기존 방법보다 우수한 성능 입증