यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
यह शोधपत्र SE-Agent का प्रस्ताव करता है, जो बड़े पैमाने के भाषा मॉडल (LLM) पर आधारित एजेंटों की समस्या-समाधान प्रक्रिया (अंतःक्रिया पथ) के अनुकूलन हेतु एक नवीन ढाँचा है। हम MCTS जैसी मौजूदा विधियों की समस्याओं का समाधान करते हैं, जो अंतःक्रिया पथों और अपर्याप्त खोज स्थान विविधता के बीच परस्पर निर्भरता को नज़रअंदाज़ करती हैं, जिसके परिणामस्वरूप अकुशल अनुमान होता है। SE-Agent तीन संक्रियाओं के माध्यम से अनुमान प्रक्रिया को पुनरावृत्त रूप से अनुकूलित करता है: मौजूदा पथों को संशोधित करना, पुनर्संयोजन करना और सुधारना। इससे यह स्थानीय इष्टतमता से परे विविध समाधान पथों का पता लगा सकता है और अकुशल पथों के प्रभाव को कम कर सकता है, जिससे प्रदर्शन में सुधार होता है। SWE-बेंच सत्यापित डेटासेट का उपयोग करके प्राप्त प्रायोगिक परिणाम दर्शाते हैं कि हमारा दृष्टिकोण अत्याधुनिक प्रदर्शन प्राप्त करता है, पाँच मज़बूत LLM पर 55% तक प्रदर्शन लाभ प्राप्त करता है।
Takeaways, Limitations
•
Takeaways:
◦
एलएलएम-आधारित एजेंटों की समस्या-समाधान प्रक्रिया को अनुकूलित करने के लिए एक नया दृष्टिकोण।
◦
मौजूदा तरीकों में अंतरनिर्भरता की अनदेखी और खोज स्थान विविधता की कमी की समस्याओं का समाधान (__T31046_____)
◦
संशोधन, पुनर्संयोजन और सुधार कार्यों के माध्यम से कुशल प्रदर्शन सुधार और अकुशल पथ प्रभाव का शमन।
◦
SWE-बेंच पर अत्याधुनिक प्रदर्शन प्राप्त करें सत्यापित (55% तक प्रदर्शन सुधार)
◦
बेहतर पहुँच के लिए ओपन सोर्स रिलीज़
•
Limitations:
◦
एसई-एजेंट का प्रदर्शन सुधार एक विशिष्ट डेटासेट (एसडब्ल्यूई-बेंच सत्यापित) तक सीमित हो सकता है।
◦
अन्य प्रकार की समस्याओं या वातावरणों के लिए सामान्यीकरण निष्पादन पर और अधिक शोध की आवश्यकता है।
◦
पैरामीटर ट्यूनिंग और तीन परिचालनों (संशोधन, पुनर्संयोजन और सुधार) के अनुकूलन पर आगे अनुसंधान की आवश्यकता है।