본 논문은 대규모 추론 모델(LRM)의 발전을 저해하는 요소인 종합적인 사고 과정(CoT) 데이터셋의 부족 문제를 해결하기 위해, 2백만 개의 CoT 과정을 포함하는 대규모 데이터셋 OmniThought를 제시합니다. OmniThought는 두 개의 강력한 LRM을 교사 모델로 사용하여 생성 및 검증되었으며, 각 CoT 과정은 추론 상세도(RV)와 인지적 난이도(CD) 점수로 주석 처리되어 있습니다. 이러한 점수는 모델이 추론 과정을 이해하는 데 적합한 CoT 상세도와 인지적 난이도 수준을 나타냅니다. OmniThought 데이터셋을 기반으로, 강력한 추론 능력과 최적의 CoT 출력 길이 및 난이도 수준을 갖춘 일련의 고성능 LRM을 학습하고 공개합니다.