दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

OR-LLM-एजेंट: स्वचालित मॉडलिंग और तर्क के साथ संचालन अनुसंधान अनुकूलन समस्याओं का समाधान LLM

Created by
  • Haebom

लेखक

बोवेन झांग, पेंगचेंग लुओ, जेनके यांग, बून-ही सूंग, चाऊ यूएन

रूपरेखा

कृत्रिम बुद्धिमत्ता (एआई) की उन्नति और गणितीय समस्या समाधान में बड़े पैमाने के भाषा मॉडल (एलएलएम) के बढ़ते अनुप्रयोग के साथ, यह पत्र OR-LLM-Agent का प्रस्ताव करता है, जो अनुमान क्षमताओं वाले एलएलएम पर आधारित स्वचालित परिचालन अनुसंधान (ओआर) समस्या समाधान के लिए एक एआई एजेंट ढांचा है। OR-LLM-Agent समस्या-समाधान प्रक्रिया को तीन चरणों में विघटित करता है: गणितीय मॉडलिंग, कोड जनरेशन और डीबगिंग, प्रत्येक चरण के लिए समर्पित उप-एजेंटों के साथ अधिक केंद्रित अनुमान को सक्षम करना। इसके अलावा, हमने LLM की OR समस्या-समाधान क्षमताओं का मूल्यांकन करने के लिए BWOR डेटासेट, एक OR समस्या समाधान डेटासेट का निर्माण किया। प्रायोगिक परिणाम बताते हैं कि DeepSeek-R1 का उपयोग करने वाला OR-LLM-Agent मौजूदा अत्याधुनिक विधियों जैसे GPT-o3, Gemini 2.5 Pro, DeepSeek-R1 और ORLM से कम से कम 7% सटीकता से बेहतर प्रदर्शन करता है हमारा लक्ष्य अनुमान-आधारित एलएलएम पर आधारित एक एजेंट फ्रेमवर्क लागू करके, त्वरित इंजीनियरिंग या फ़ाइन-ट्यूनिंग रणनीतियों पर निर्भर मौजूदा विधियों की सीमाओं को दूर करना था। हालाँकि मौजूदा बेंचमार्क (NL4OPT, MAMO, IndustryOR) ने दिखाया है कि अनुमानात्मक एलएलएम कभी-कभी समान मॉडल परिवार के गैर-अनुमानात्मक एलएलएम से कमतर प्रदर्शन करते हैं, लेकिन हाल ही में प्रस्तुत BWOR डेटासेट दर्शाता है कि मॉडल क्षमताओं का मूल्यांकन अधिक सुसंगत और विभेदक रूप से किया जा सकता है।

Takeaways, Limitations

Takeaways:
हम प्रयोगात्मक रूप से प्रदर्शित करते हैं कि OR समस्या समाधान की सटीकता को अनुमान LLM पर आधारित कार्य विघटन रणनीति के माध्यम से सुधारा जा सकता है।
हम एक नया OR डेटासेट, BWOR प्रस्तुत करते हैं, जो मौजूदा LLM मूल्यांकन मानदंडों की सीमाओं का पूरक है।
हम OR-LLM-Agent की प्रभावशीलता प्रस्तुत करते हैं, जो OR समस्याओं को हल करने के लिए एक नवीन AI एजेंट फ्रेमवर्क है।
Limitations:
बीडब्ल्यूओआर डेटासेट के पैमाने और विविधता पर आगे अनुसंधान की आवश्यकता है।
विभिन्न प्रकार की OR समस्याओं के लिए OR-LLM-एजेंट के सामान्यीकरण प्रदर्शन का मूल्यांकन करने की आवश्यकता है।
उप-एजेंटों के एक-दूसरे के साथ बातचीत और संवाद करने के तरीके में सुधार की गुंजाइश है।
वास्तविक दुनिया की औद्योगिक समस्याओं के लिए अनुप्रयोग और प्रदर्शन सत्यापन आवश्यक है।
👍