Learning How to Use Tools, Not Just When: Pattern-Aware Tool-Integrated Reasoning
Created by
Haebom
Category
Empty
저자
Ningning Xu, Yuxuan Jiang, Shubhashis Roy Dipta
개요
본 논문은 복잡한 문제 해결을 위해 도구 통합 추론(TIR)을 연구하며, 특히 도구 적용 방식에 주목한다. 계산 패턴과 알고리즘 패턴의 두 가지 일반적인 패턴을 식별하고, 패턴 선택과 교사 선호도를 일치시키는 2단계 프레임워크를 제안한다. 이를 통해 코드 사용과 정확도를 향상시켰으며, MATH500에서 Code@1을 64.0%에서 70.5%로, AIME24에서 26.7%에서 50.0%로 향상시키는 성과를 거두었다.