Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Beyond ReAct: A Planner-Centric Framework for Complex Tool-Augmented LLM Reasoning

Created by
  • Haebom
Category
Empty

저자

Xiaolong Wei, Yuehu Dong, Xingliang Wang, Xingyu Zhang, Zhejun Zhao, Dongdong Shen, Long Xia, Dawei Yin

개요

도구 보조 대규모 언어 모델(LLM)이 복잡한 질의를 처리할 때 겪는 어려움을 해결하기 위해, 본 논문은 국소적 최적화의 문제점을 근본적으로 해결하는 새로운 Planner 중심 Plan-Execute 패러다임을 제안합니다. 이는 복잡한 질의에 대한 전역적 방향성 비순환 그래프(DAG) 계획을 수행하는 Planner 모델을 중심으로 이루어집니다. 본 논문은 또한 복잡한 멀티 도구 구성 및 조정을 요구하는 복잡한 질의를 특징으로 하는 대규모 벤치마크 데이터 세트인 ComplexTool-Plan을 도입합니다. 또한, Supervised Fine-Tuning(SFT)과 Group Relative Policy Optimization(GRPO)을 통합하는 2단계 학습 방법론을 개발하여 Planner의 도구 선택 정확도와 구조화된 DAG 기반 계획을 통한 전역 계획 인식을 체계적으로 향상시킵니다. 유능한 executor와 통합될 때, 제안된 프레임워크는 복잡한 사용자 질의에 대해 StableToolBench 벤치마크에서 최고 성능을 달성하여, 우수한 종단간 실행 능력과 복잡한 멀티 도구 워크플로우를 강력하게 처리하는 능력을 보여줍니다.

시사점, 한계점

시사점:
국소적 최적화 문제를 해결하는 Planner 중심 Plan-Execute 패러다임 제안.
복잡한 질의 처리를 위한 새로운 벤치마크 데이터세트 ComplexTool-Plan 도입.
Planner의 성능 향상을 위한 SFT와 GRPO를 결합한 2단계 학습 방법론 제시.
StableToolBench 벤치마크에서 최고 성능 달성.
한계점:
구체적인 한계점은 논문 요약에서 명시되지 않음. (논문 원문을 참조 필요)
👍