Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

OrchDAG: Complex Tool Orchestration in Multi-Turn Interactions with Plan DAGs

Created by
  • Haebom

저자

Yifu Lu, Shengjie Liu, Li Dong

개요

Agentic tool 사용이 에이전트 기반 도구 호출의 증가와 함께 주목받고 있지만, 대부분의 기존 연구는 다중 턴 도구 상호 작용의 복잡성을 간과하고 있습니다. 우리는 도구 실행을 제어 가능한 복잡성을 가진 방향성 비순환 그래프(DAG)로 모델링하는 합성 데이터 생성 파이프라인인 OrchDAG를 소개합니다. 이 데이터 세트를 사용하여 모델 성능을 벤치마킹하고, RLVR 훈련을 향상시키기 위한 그래프 기반 보상을 제안합니다. 실험 결과, 이 데이터 세트가 어렵지만 해결 가능한 벤치마크를 제시하며, 제안된 보상이 GRPO 스타일 알고리즘과 결합될 때 효과적임을 보여줍니다. 이는 다중 턴 도구 사용에서 위상 구조와 데이터 복잡성을 활용하는 것이 중요하다는 점을 강조합니다.

시사점, 한계점

시사점:
OrchDAG 데이터 세트를 통해 다중 턴 도구 사용의 복잡성을 모델링하고 평가할 수 있는 새로운 벤치마크를 제공합니다.
그래프 기반 보상을 제안하여 RLVR 훈련을 개선하고, 다중 턴 도구 사용에서 위상 구조의 중요성을 강조합니다.
GRPO 스타일 알고리즘과의 결합을 통해 제안된 보상의 효과를 입증했습니다.
한계점:
논문에서 구체적인 한계점이 명시적으로 언급되지 않았습니다.
👍