본 논문은 추론 시간에 추가적인 컴퓨팅 자원을 할당하여 사전 훈련된 대형 언어 모델의 예측 정확도를 향상시키는 기술들을 조사한다. 특히, 문제 분해 방식과 부분 문제들의 위상적 구성(순차적, 병렬적, 트리 구조)에 중점을 두고, 추론 시간 스케일링 방법을 분류한다. Chain-of-Thought, Branch-Solve-Merge, Tree-of-Thought 등 다양한 접근 방식을 통합적으로 조망하며, 이 기술들의 강점과 약점을 분석하고 향후 연구 방향을 제시한다.