RATIONALYST: Mining Implicit Rationales for Process Supervision of Reasoning
Created by
Haebom
저자
Dongwei Jiang, Guoxuan Wang, Yining Lu, Andrew Wang, Jingyu Zhang, Chuyu Liu, Benjamin Van Durme, Daniel Khashabi
개요
RATIONALYST는 대규모 언어 모델(LLM)이 추론 과정에서 암묵적으로 가정하는 논리적 도약을 해결하기 위해 고안된 모델입니다. 웹 규모의 비표지 데이터(Pile)와 다양한 추론 데이터셋에서 79,000개의 추론 근거를 추출하여 사전 훈련되었습니다. 이를 통해 수학, 상식, 과학, 논리 추론 등 다양한 추론 작업에서 일반화 성능을 향상시켰으며, LLaMa-3-8B를 기반으로 미세 조정하여 7개의 대표적인 추론 벤치마크에서 평균 3.9%의 정확도 향상을 달성했습니다. GPT-4와 같은 대규모 검증 모델 및 유사한 크기의 모델보다 우수한 성능을 보였습니다.