Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents
Created by
Haebom
Category
Empty
저자
Yueqi Song, Ketan Ramaneti, Zaid Sheikh, Ziru Chen, Boyu Gou, Tianbao Xie, Yiheng Xu, Danyang Zhang, Apurva Gandhi, Fan Yang, Joseph Liu, Tianyue Ou, Zhihao Yuan, Frank Xu, Shuyan Zhou, Xingyao Wang, Xiang Yue, Tao Yu, Huan Sun, Yu Su, Graham Neubig
개요
AI 에이전트의 대규모 지도 학습 파인튜닝에 대한 공개 연구 결과는 에이전트 훈련 데이터 수집의 어려움으로 인해 드문 편입니다. 본 논문에서는 데이터 소스의 부족이 아니라 다양한 데이터가 이질적인 형식, 도구 및 인터페이스에 걸쳐 분산되어 있는 것이 문제라고 주장합니다. 이를 위해, 다양한 형식의 에이전트 데이터 세트와 통일된 에이전트 훈련 파이프라인 사이의 "중간 언어" 역할을 하는 경량 표현 언어인 에이전트 데이터 프로토콜(ADP)을 소개합니다. ADP는 API/도구 사용, 브라우징, 코딩, 소프트웨어 엔지니어링 및 일반적인 에이전트 워크플로우를 포함한 다양한 작업을 캡처할 수 있을 만큼 표현력이 풍부하면서도, 데이터 세트별 엔지니어링 없이 간단하게 파싱하고 훈련할 수 있도록 설계되었습니다. 실험에서, 13개의 기존 에이전트 훈련 데이터 세트를 ADP 형식으로 통합하고, 표준화된 ADP 데이터를 여러 에이전트 프레임워크에 대한 훈련 준비 형식으로 변환했습니다. 이 데이터를 기반으로 SFT를 수행하여, 해당 기본 모델보다 평균 ~20%의 성능 향상을 보였으며, 도메인별 튜닝 없이 표준 코딩, 브라우징, 도구 사용 및 연구 벤치마크에서 SOTA 또는 거의 SOTA 성능을 달성했습니다. ADP가 표준화되고 확장 가능하며 재현 가능한 에이전트 훈련의 장벽을 낮추는 데 기여할 수 있도록 모든 코드와 데이터를 공개적으로 릴리스했습니다.