Daily Arxiv

This page organizes papers related to artificial intelligence published around the world.
This page is summarized using Google Gemini and is operated on a non-profit basis.
The copyright of the paper belongs to the author and the relevant institution. When sharing, simply cite the source.

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration

Created by
  • Haebom
Category
Empty

저자

Hongjin Su, Shizhe Diao, Ximing Lu, Mingjie Liu, Jiacheng Xu, Xin Dong, Yonggan Fu, Peter Belcak, Hanrong Ye, Hongxu Yin, Yi Dong, Evelina Bakhturina, Tao Yu, Yejin Choi, Jan Kautz, Pavlo Molchanov

개요

본 논문은 대규모 언어 모델이 강력한 일반성을 가지지만, Humanity's Last Exam (HLE)과 같은 복잡한 문제를 해결하는 데 어려움이 있다는 점을 지적합니다. 소규모 오케스트레이터가 다른 모델과 다양한 도구를 관리하는 방식으로 지능의 상한을 높이고, 어려운 에이전트 작업의 효율성을 향상시킬 수 있음을 보입니다. ToolOrchestra라는, 지능형 도구를 조정하는 소규모 오케스트레이터를 훈련하는 방법을 제시합니다. ToolOrchestra는 결과, 효율성, 사용자 선호도를 고려한 보상으로 강화 학습을 사용합니다. ToolOrchestra를 사용하여, 이전의 도구 사용 에이전트보다 높은 정확도를 달성하고 비용은 절감하면서, 주어진 쿼리에 어떤 도구를 사용할지에 대한 사용자 선호도에 부합하는 8B 모델인 Orchestrator를 생성했습니다. Orchestrator는 HLE에서 GPT-5를 능가하며, tau2-Bench와 FRAMES에서도 GPT-5를 큰 차이로 앞섭니다.

시사점, 한계점

시사점:
소규모 오케스트레이터를 사용하여 다양한 도구를 조합하는 것이 기존 방법보다 효율적이고 효과적임을 입증했습니다.
실용적이고 확장 가능한 도구 증강 추론 시스템 개발의 가능성을 열었습니다.
Orchestrator는 HLE에서 GPT-5를 능가하는 성능을 보였으며, 비용 효율성도 높습니다.
다양한 지표에서 성능과 비용 사이의 최적 균형을 달성하며, 보이지 않는 도구에도 강력한 일반화 성능을 보입니다.
한계점:
논문에서 구체적인 한계점은 명시되어 있지 않습니다.
👍