DeepCompress는 Large Reasoning Models (LRMs)의 정확성과 효율성을 동시에 향상시키는 새로운 프레임워크입니다. 기존 방법들이 효율성 향상에 집중하며 정확도를 희생하는 경향이 있는 반면, DeepCompress는 모델의 능동적인 문제 난이도 판단을 기반으로 합니다. "Simple" 문제에는 짧고 효율적인 추론을, "Hard" 문제에는 길고 탐구적인 사고 과정을 장려하는 적응형 길이 보상 메커니즘을 사용합니다. 실험 결과, DeepCompress는 어려운 수학 벤치마크에서 기존 방법들을 능가하며, 정확도와 토큰 효율성을 모두 개선했습니다.