TInR: Exploring Tool-Internalized Reasoning in Large Language Models
Author
Haebom
Category
Empty
저자
Qiancheng Xu, Yongqi Li, Fan Liu, Hongru Wang, Min Yang, Wenjie Li
💡 개요
기존 도구 통합 추론(TIR) 방식이 외부 도구 문서를 사용하며 발생하는 어려움을 해결하기 위해, 본 논문은 도구 지식을 LLM 내부에 통합하는 도구 내부화 추론(TInR)을 제안합니다. TInR-U는 통합된 추론 및 도구 사용을 위한 프레임워크로, 3단계 훈련 파이프라인을 통해 도구 내부화, 지도 학습 예열, 강화 학습을 수행합니다. 실험 결과, TInR-U는 다양한 환경에서 기존 방법론 대비 우수한 성능과 효율성을 보여주었습니다.
🔑 시사점 및 한계
•
LLM 자체에 도구 지식을 내재화함으로써 외부 도구 의존성을 줄여 추론 효율성과 도구 숙련도를 향상시킬 수 있습니다.
•
제안된 TInR-U 프레임워크는 복잡한 추론 문제에서 LLM의 성능을 크게 향상시키는 효과적인 접근 방식을 제시합니다.
•
도구 내부화 과정의 복잡성과 다양한 유형의 도구에 대한 일반화 성능 개선은 향후 연구 과제로 남습니다.