도구 보조 대규모 언어 모델(LLM)이 복잡한 질의를 처리할 때 겪는 어려움을 해결하기 위해, 본 논문은 국소적 최적화의 문제점을 근본적으로 해결하는 새로운 Planner 중심 Plan-Execute 패러다임을 제안합니다. 이는 복잡한 질의에 대한 전역적 방향성 비순환 그래프(DAG) 계획을 수행하는 Planner 모델을 중심으로 이루어집니다. 본 논문은 또한 복잡한 멀티 도구 구성 및 조정을 요구하는 복잡한 질의를 특징으로 하는 대규모 벤치마크 데이터 세트인 ComplexTool-Plan을 도입합니다. 또한, Supervised Fine-Tuning(SFT)과 Group Relative Policy Optimization(GRPO)을 통합하는 2단계 학습 방법론을 개발하여 Planner의 도구 선택 정확도와 구조화된 DAG 기반 계획을 통한 전역 계획 인식을 체계적으로 향상시킵니다. 유능한 executor와 통합될 때, 제안된 프레임워크는 복잡한 사용자 질의에 대해 StableToolBench 벤치마크에서 최고 성능을 달성하여, 우수한 종단간 실행 능력과 복잡한 멀티 도구 워크플로우를 강력하게 처리하는 능력을 보여줍니다.