본 논문은 테스트 시간 계산 확장(test-time compute scaling)에 대한 종합적인 조사가 부족함을 지적하며, 이 개념을 System-1 모델에서부터 거슬러 올라가 System-2 모델까지의 발전 과정을 추적합니다. System-1 모델에서는 매개변수 업데이트, 입력 수정, 표현 편집, 출력 보정 등을 통해 분포 이동을 해결하고 강건성 및 일반화 성능을 향상시키는 데 사용되는 반면, System-2 모델에서는 반복적 샘플링, 자기 수정, 트리 탐색 등을 통해 복잡한 문제 해결 능력을 향상시킵니다. 논문은 System-1 사고에서 System-2 사고로의 전환 과정에서 테스트 시간 계산의 중요한 역할을 강조하며, System-1 모델에서 약한 System-2 모델, 그리고 강한 System-2 모델로의 전환 과정을 체계적으로 정리하고, 향후 연구 방향을 제시합니다. 특히, 복잡한 추론에서 o1 모델의 놀라운 성능은 테스트 시간 계산 확장을 통해 모델의 잠재력을 더욱 발휘하여 강력한 System-2 사고를 가능하게 함을 보여줍니다.