본 논문은 대규모 언어 모델(LLM)의 활용 시나리오를 확장하는 도구 학습 방법으로, 기존 방법들의 한계인 미세 조정 필요성 및 프롬프트에 도구 데모 추가의 비효율성을 극복하는 "Chain-of-Tools"를 제시합니다. Chain-of-Tools는 동결된 LLM의 강력한 의미 표현 능력을 활용하여 CoT 추론을 통해 방대한 유연한 도구 풀(미지의 도구 포함)에서 도구 호출을 수행합니다. 새로운 데이터셋 SimpleToolQuestions를 구축하여 미지의 도구 시나리오에서의 효과를 검증하고, GSM8K-XL, FuncQA, KAMEL, SimpleToolQuestions 등의 벤치마크에서 기존 방법보다 우수한 성능을 보임을 실험적으로 입증합니다. 또한, 모델 해석력 향상을 위해 도구 선택에 중요한 모델 출력 차원을 파악합니다. 코드와 데이터는 Github에서 공개됩니다.