कृत्रिम बुद्धिमत्ता (एआई) की उन्नति और गणितीय समस्या समाधान में बड़े पैमाने के भाषा मॉडल (एलएलएम) के बढ़ते अनुप्रयोग के साथ, यह पत्र OR-LLM-Agent का प्रस्ताव करता है, जो अनुमान क्षमताओं वाले एलएलएम पर आधारित स्वचालित परिचालन अनुसंधान (ओआर) समस्या समाधान के लिए एक एआई एजेंट ढांचा है। OR-LLM-Agent समस्या-समाधान प्रक्रिया को तीन चरणों में विघटित करता है: गणितीय मॉडलिंग, कोड जनरेशन और डीबगिंग, प्रत्येक चरण के लिए समर्पित उप-एजेंटों के साथ अधिक केंद्रित अनुमान को सक्षम करना। इसके अलावा, हमने LLM की OR समस्या-समाधान क्षमताओं का मूल्यांकन करने के लिए BWOR डेटासेट, एक OR समस्या समाधान डेटासेट का निर्माण किया। प्रायोगिक परिणाम बताते हैं कि DeepSeek-R1 का उपयोग करने वाला OR-LLM-Agent मौजूदा अत्याधुनिक विधियों जैसे GPT-o3, Gemini 2.5 Pro, DeepSeek-R1 और ORLM से कम से कम 7% सटीकता से बेहतर प्रदर्शन करता है हमारा लक्ष्य अनुमान-आधारित एलएलएम पर आधारित एक एजेंट फ्रेमवर्क लागू करके, त्वरित इंजीनियरिंग या फ़ाइन-ट्यूनिंग रणनीतियों पर निर्भर मौजूदा विधियों की सीमाओं को दूर करना था। हालाँकि मौजूदा बेंचमार्क (NL4OPT, MAMO, IndustryOR) ने दिखाया है कि अनुमानात्मक एलएलएम कभी-कभी समान मॉडल परिवार के गैर-अनुमानात्मक एलएलएम से कमतर प्रदर्शन करते हैं, लेकिन हाल ही में प्रस्तुत BWOR डेटासेट दर्शाता है कि मॉडल क्षमताओं का मूल्यांकन अधिक सुसंगत और विभेदक रूप से किया जा सकता है।