본 논문은 복잡하고 논리적인 작업 해결을 위해 확장된 사고 과정(Chain-of-Thoughts, CoTs)을 생성하는 추론 모델의 발전에 대해 논의합니다. 긴 사고 과정 생성으로 인한 높은 계산 비용 문제를 해결하기 위해 효율적인 추론 가속화 방법을 제시하는 최근 연구들을 종합적으로 검토합니다. 주요 연구 방향으로는 긴 CoTs를 간결하게 압축하는 방법, 강력한 추론 능력을 가진 소형 언어 모델 개발, 그리고 추론 속도를 높이는 효율적인 디코딩 전략 등 세 가지를 제시합니다. GitHub 저장소에 논문에서 다룬 연구 목록을 제공합니다.