본 논문은 Chain-of-Thought (CoT) 프롬프팅을 사용한 정보 검색(IR)에서 발생하는 과도한 추론(overthinking) 문제를 해결하기 위해 State Machine Reasoning (SMR) 프레임워크를 제안합니다. SMR은 'Refine', 'Rerank', 'Stop'과 같은 이산적인 행동들로 구성된 전이 기반 추론 프레임워크로, 조기 중단 및 세분화된 제어를 지원하여 중복된 경로 및 사용자 의도와 다른 추론을 방지합니다. BEIR 및 BRIGHT 벤치마크 실험 결과, SMR은 기존 CoT 추론 대비 검색 성능(nDCG@10)을 3.4% 향상시키고 토큰 사용량을 74.4% 감소시키는 효과를 보였으며, 특정 작업에 대한 조정 없이 다양한 LLMs 및 검색기에 일반화될 수 있음을 보여줍니다.