OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation
Created by
Haebom
저자
Mengkang Hu, Yuhang Zhou, Wendong Fan, Yuzhou Nie, Bowei Xia, Tao Sun, Ziyu Ye, Zhaoxuan Jin, Yingru Li, Qiguang Chen, Zeyu Zhang, Yifeng Wang, Qianshuo Ye, Bernard Ghanem, Ping Luo, Guohao Li
개요
본 논문은 도메인 특화적인 대규모 언어 모델(LLM) 기반 다중 에이전트 시스템의 도메인 간 전이 문제를 해결하기 위해 계층적 다중 에이전트 프레임워크인 Workforce를 제안합니다. Workforce는 도메인에 무관한 Planner, Coordinator, 그리고 도메인 특화된 Worker로 구성된 모듈형 아키텍처를 통해 전략적 계획과 특수한 실행을 분리합니다. 이러한 분리는 추론 및 훈련 단계 모두에서 도메인 간 전이성을 가능하게 합니다. 추론 단계에서는 Worker 에이전트를 추가하거나 수정하여 새로운 도메인에 적응하고, 훈련 단계에서는 실제 환경 피드백으로부터 도메인에 무관한 Planner를 강화 학습하여 일반화 성능을 향상시키는 Optimized Workforce Learning (OWL)을 사용합니다. GAIA 벤치마크를 사용한 실험 결과, Workforce는 오픈소스 최고 성능(69.70%)을 달성했으며, 상용 시스템인 OpenAI의 Deep Research보다 2.34% 앞섰습니다. 특히, OWL로 훈련된 32B 모델은 52.73%의 정확도를 달성하여 어려운 작업에서 GPT-4o와 비슷한 성능을 보였습니다. 결론적으로, Workforce는 확장 가능한 일반화 및 모듈식 도메인 전이를 가능하게 하여 차세대 범용 AI 어시스턴트의 기반을 마련합니다.