TInR: Exploring Tool-Internalized Reasoning in Large Language Models

Author

Haebom

저자

Qiancheng Xu, Yongqi Li, Fan Liu, Hongru Wang, Min Yang, Wenjie Li

💡 개요

기존 도구 통합 추론(TIR) 방식이 외부 도구 문서를 사용하며 발생하는 어려움을 해결하기 위해, 본 논문은 도구 지식을 LLM 내부에 통합하는 도구 내부화 추론(TInR)을 제안합니다. TInR-U는 통합된 추론 및 도구 사용을 위한 프레임워크로, 3단계 훈련 파이프라인을 통해 도구 내부화, 지도 학습 예열, 강화 학습을 수행합니다. 실험 결과, TInR-U는 다양한 환경에서 기존 방법론 대비 우수한 성능과 효율성을 보여주었습니다.

🔑 시사점 및 한계

•

LLM 자체에 도구 지식을 내재화함으로써 외부 도구 의존성을 줄여 추론 효율성과 도구 숙련도를 향상시킬 수 있습니다.

•

제안된 TInR-U 프레임워크는 복잡한 추론 문제에서 LLM의 성능을 크게 향상시키는 효과적인 접근 방식을 제시합니다.

•

도구 내부화 과정의 복잡성과 다양한 유형의 도구에 대한 일반화 성능 개선은 향후 연구 과제로 남습니다.

PDF 보기

Made with Slashpage