Agent0-VL: Exploring Self-Evolving Agent for Tool-Integrated Vision-Language Reasoning
Created by
Haebom
Category
Empty
저자
Jiaqi Liu, Kaiwen Xiong, Peng Xia, Yiyang Zhou, Haonian Ji, Lu Feng, Siwei Han, Mingyu Ding, Huaxiu Yao
개요
Agent0-VL은 시각-언어 에이전트의 자기 개선을 위해 도구 통합 추론을 활용하는 자기 진화형 에이전트입니다. 이 모델은 Solver와 Verifier의 두 가지 역할을 통합하여 도구 기반 검증 및 강화 학습을 통해 추론과 평가 분포를 정렬하고 지속적인 자기 개선을 달성합니다. Agent0-VL은 외부 보상 없이 자체적으로 개선을 이뤄내며, 기하 문제 해결 및 시각적 과학 분석에서 기반 모델 대비 12.5%의 성능 향상을 보였습니다.
시사점, 한계점
•
시사점:
◦
도구 통합 추론을 통한 자기 평가 및 자기 수정 능력 향상
◦
외부 보상 없이 지속적인 자기 개선 달성
◦
기하 문제 해결 및 시각적 과학 분석에서 우수한 성능
•
한계점:
◦
제시된 논문 내용만으로는 구체적인 한계점을 파악하기 어려움 (추가적인 성능 비교 대상 부재, 일반화 가능성 등)