본 논문은 Chain-of-Thought(CoT)와 Looped Transformers의 추론 능력을 비교 분석합니다. 실험적으로 추론 작업 성능을 향상시키고 계산 단계를 반복적으로 증가시켜 표현력을 이론적으로 향상시키는 것으로 알려진 두 방법의 상대적 강점과 한계를 공식적으로 분석합니다. Looped Transformers는 결정적 작업에 대한 병렬 계산을 효율적으로 시뮬레이션할 수 있으며, 이는 방향성 비순환 그래프(DAG) 상의 평가로 공식화됩니다. 반면, 확률적 디코딩을 사용하는 CoT는 자기 감소 문제와 같은 구성 구조에 대한 근사 추론에 탁월합니다. 이러한 구분은 깊이 중심 재귀가 더 적합한 작업을 제시하여 추론 패러다임 선택에 대한 실용적인 단서를 제공합니다.