दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एसई-एजेंट: एलएलएम-आधारित एजेंटों के साथ बहु-चरणीय तर्क में आत्म-विकास प्रक्षेप पथ अनुकूलन

Created by
  • Haebom

लेखक

जियाये लिन, यिफू गुओ, युज़ेन हान, सेन हू, ज़ियी नी, लिचेंग वांग, मिंगगुआंग चेन, डैक्सिन जियांग, बिनक्सिंग जिओ, चेन हू, हुआकन वांग

रूपरेखा

यह शोधपत्र SE-Agent का प्रस्ताव करता है, जो बड़े पैमाने के भाषा मॉडल (LLM) पर आधारित एजेंटों की समस्या-समाधान प्रक्रिया (अंतःक्रिया पथ) के अनुकूलन हेतु एक नवीन ढाँचा है। हम MCTS जैसी मौजूदा विधियों की समस्याओं का समाधान करते हैं, जो अंतःक्रिया पथों और अपर्याप्त खोज स्थान विविधता के बीच परस्पर निर्भरता को नज़रअंदाज़ करती हैं, जिसके परिणामस्वरूप अकुशल अनुमान होता है। SE-Agent तीन संक्रियाओं के माध्यम से अनुमान प्रक्रिया को पुनरावृत्त रूप से अनुकूलित करता है: मौजूदा पथों को संशोधित करना, पुनर्संयोजन करना और सुधारना। इससे यह स्थानीय इष्टतमता से परे विविध समाधान पथों का पता लगा सकता है और अकुशल पथों के प्रभाव को कम कर सकता है, जिससे प्रदर्शन में सुधार होता है। SWE-बेंच सत्यापित डेटासेट का उपयोग करके प्राप्त प्रायोगिक परिणाम दर्शाते हैं कि हमारा दृष्टिकोण अत्याधुनिक प्रदर्शन प्राप्त करता है, पाँच मज़बूत LLM पर 55% तक प्रदर्शन लाभ प्राप्त करता है।

Takeaways, Limitations

Takeaways:
एलएलएम-आधारित एजेंटों की समस्या-समाधान प्रक्रिया को अनुकूलित करने के लिए एक नया दृष्टिकोण।
मौजूदा तरीकों में अंतरनिर्भरता की अनदेखी और खोज स्थान विविधता की कमी की समस्याओं का समाधान (__T31046_____)
संशोधन, पुनर्संयोजन और सुधार कार्यों के माध्यम से कुशल प्रदर्शन सुधार और अकुशल पथ प्रभाव का शमन।
SWE-बेंच पर अत्याधुनिक प्रदर्शन प्राप्त करें सत्यापित (55% तक प्रदर्शन सुधार)
बेहतर पहुँच के लिए ओपन सोर्स रिलीज़
Limitations:
एसई-एजेंट का प्रदर्शन सुधार एक विशिष्ट डेटासेट (एसडब्ल्यूई-बेंच सत्यापित) तक सीमित हो सकता है।
अन्य प्रकार की समस्याओं या वातावरणों के लिए सामान्यीकरण निष्पादन पर और अधिक शोध की आवश्यकता है।
पैरामीटर ट्यूनिंग और तीन परिचालनों (संशोधन, पुनर्संयोजन और सुधार) के अनुकूलन पर आगे अनुसंधान की आवश्यकता है।
👍