본 논문은 운영 연구(Operations Research, OR) 분야에서 모델의 실행 불가능성(infeasibility)을 디버깅하는 반복적인 과정을 자동화하기 위한 새로운 벤치마크인 ORLoopBench를 제안한다. 제안된 방법론은 고전적인 OR 디버깅 프로세스를 해결사(solver)와 반복적으로 상호작용하는 마르코프 결정 과정(MDP)으로 모델링하여, 각 단계에서 해결사의 피드백을 받아 모델을 수정해 나간다. ORLoopBench는 OR-Debug-Bench와 OR-Bias-Bench의 두 가지 구성으로 이루어져 있으며, 특히 LLM 모델이 OR 디버깅 및 의사 결정의 합리성을 평가하고 향상시키는 데 기여한다.