본 논문은 운영 연구(OR) 문제 해결에 대규모 언어 모델(LLM)을 적용하는 새로운 접근 방식인 OR-LLM-Agent를 제시합니다. 기존의 프롬프트 엔지니어링이나 미세 조정 전략에 의존하는 방법들과 달리, OR-LLM-Agent는 추론 능력을 갖춘 LLM을 기반으로 문제를 수학적 모델링, 코드 생성, 디버깅의 세 단계로 분해하여 처리합니다. 각 단계는 전문화된 하위 에이전트가 담당하며, 이를 통해 보다 효과적인 추론이 가능합니다. 또한, 기존의 NL4OPT, MAMO, IndustryOR 등의 벤치마크의 한계를 지적하고, 더욱 신뢰할 수 있는 LLM 성능 평가를 위해 고품질 데이터셋 BWOR를 구축했습니다. 실험 결과, OR-LLM-Agent는 GPT-o3, Gemini 2.5 Pro, ORLM 등 기존 최첨단 방법들보다 정확도 면에서 최소 7% 이상의 성능 향상을 보였습니다. 이는 OR 문제 해결을 위한 작업 분해의 효과를 보여줍니다.