दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एसई-एजेंट: एलएलएम-आधारित एजेंटों के साथ बहु-चरणीय तर्क में आत्म-विकास प्रक्षेप पथ अनुकूलन

Created by
  • Haebom

लेखक

जियाये लिन, यिफू गुओ, युज़ेन हान, सेन हू, ज़ियी नी, लिचेंग वांग, मिंगगुआंग चेन, डैक्सिन जियांग, बिनक्सिंग जिओ, चेन हू, हुआकन वांग

रूपरेखा

यह शोधपत्र एसई-एजेंट का प्रस्ताव करता है, जो बड़े पैमाने के भाषा मॉडल (एलएलएम) पर आधारित एजेंटों की समस्या-समाधान प्रक्रिया (अंतःक्रिया पथ) के अनुकूलन हेतु एक नवीन ढाँचा है। हम एमसीटीएस जैसी मौजूदा विधियों की अकुशलताओं पर प्रकाश डालते हैं, जो परस्पर निर्भरता और विविध खोज स्थान के अभाव के कारण हैं। एसई-एजेंट तीन क्रियाओं के माध्यम से समस्या-समाधान प्रक्रिया को स्व-विकासशील तरीके से अनुकूलित करता है: मौजूदा पथों को संशोधित करना, पुनर्संयोजित करना और सुधारना। इससे यह विविध समाधान पथों का पता लगा सकता है और अकुशल पथों के प्रभाव को कम कर सकता है, जिससे प्रदर्शन में सुधार होता है। एसडब्ल्यूई-बेंच वेरिफाइड का उपयोग करके प्राप्त प्रायोगिक परिणाम दर्शाते हैं कि हमारा दृष्टिकोण अत्याधुनिक प्रदर्शन प्राप्त करता है, पाँच मज़बूत एलएलएम पर 55% तक प्रदर्शन लाभ प्राप्त करता है।

Takeaways, Limitations

Takeaways:
एलएलएम-आधारित एजेंटों की समस्या-समाधान प्रक्रिया को अनुकूलित करने के लिए एक नया दृष्टिकोण।
स्व-विकासवादी ढांचे के माध्यम से खोज स्थान का विस्तार करना और प्रदर्शन में सुधार करना।
मौजूदा मार्गों के पुन: उपयोग के माध्यम से कुशल शिक्षण
वास्तविक GitHub समस्याओं को हल करके व्यावहारिकता को सत्यापित किया गया और उत्कृष्ट प्रदर्शन (55% तक प्रदर्शन सुधार) हासिल किया गया।
खुले स्रोत प्रकटीकरण के माध्यम से पहुँच में सुधार
Limitations:
प्रस्तावित ढांचे की सामान्यता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
चूंकि मूल्यांकन परिणाम एक विशिष्ट डोमेन (GitHub समस्या) के लिए हैं, इसलिए अन्य डोमेन के लिए मापनीयता का सत्यापन आवश्यक है।
गणना लागत में संभावित वृद्धि (स्व-विकास प्रक्रिया की बार-बार गणना)
SWE-बेंच सत्यापित डेटासेट पर निर्भरता
👍