दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

आरसीआर-राउटर: संरचित मेमोरी वाले मल्टी-एजेंट एलएलएम सिस्टम के लिए कुशल भूमिका-जागरूक संदर्भ रूटिंग

Created by
  • Haebom

लेखक

जून लियू, झेंग्लुन कोंग, चांगडी यांग, फैन यांग, तियानकी ली, पीयान डोंग, जोआना नानजेकी, हाओ तांग, गेंग युआन, वेई नीयू, वेनबिन झांग, पु झाओ, ज़ू लिन, डोंग हुआंग, यान्झी वांग

रूपरेखा

यह शोधपत्र बहु-एजेंट वृहद-स्तरीय भाषा मॉडल (LLM) प्रणालियों में कुशल सहयोग के लिए एक नवीन रूटिंग ढाँचा, RCR-Router, प्रस्तावित करता है। मौजूदा स्थिर या पूर्ण-संदर्भ रूटिंग रणनीतियों की सीमाओं को पार करने के लिए, RCR-Router एक मॉड्यूलर, भूमिका-सचेत दृष्टिकोण अपनाता है जो प्रत्येक एजेंट की भूमिका और कार्य चरण के आधार पर अर्थगत रूप से प्रासंगिक मेमोरी उपसमूहों का गतिशील रूप से चयन करता है। यह एक सख्त टोकन बजट का पालन करते हुए प्राप्त किया जाता है। एक हल्की स्कोरिंग नीति मेमोरी चयन का मार्गदर्शन करती है, और एजेंट आउटपुट को एक साझा मेमोरी स्टोर में बार-बार मर्ज किया जाता है, जिससे वृद्धिशील संदर्भ परिशोधन संभव होता है। इसके अलावा, हम उत्तर गुणवत्ता स्कोर मीट्रिक प्रस्तुत करते हैं, जो मॉडल के प्रदर्शन का बेहतर मूल्यांकन करने के लिए LLM द्वारा उत्पन्न स्पष्टीकरणों को समाहित करता है। तीन बहु-हॉप QA बेंचमार्क—HotPotQA, MuSiQue, और 2WikiMultihop—पर प्रायोगिक परिणाम दर्शाते हैं कि RCR-Router टोकन उपयोग को 30% तक कम करते हुए उत्तर गुणवत्ता को बनाए रखता है या सुधारता है।

Takeaways, Limitations

Takeaways:
हम आरसीआर-राउटर प्रस्तुत करते हैं, जो बहु-एजेंट एलएलएम प्रणालियों में कुशल सहयोग के लिए एक नवीन रूटिंग फ्रेमवर्क है।
भूमिका-जागरूक और गतिशील मेमोरी रूटिंग टोकन उपयोग को कम करता है और प्रतिक्रिया गुणवत्ता को बनाए रखता है या सुधारता है।
उत्तर गुणवत्ता स्कोर संकेतक का प्रस्ताव करके मूल्यांकन पद्धति में सुधार करना जो एलएलएम निर्माण विवरण को ध्यान में रखता है।
संरचित मेमोरी रूटिंग और आउटपुट-जागरूक मूल्यांकन के महत्व पर जोर दें।
Limitations:
प्रस्तावित आरसीआर-राउटर का प्रदर्शन एक विशिष्ट बेंचमार्क तक सीमित प्रायोगिक परिणामों पर आधारित है। विभिन्न कार्यों और डेटासेट पर अतिरिक्त प्रयोगों की आवश्यकता है।
उत्तर गुणवत्ता स्कोर सूचक की सामान्यता और वस्तुनिष्ठता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
हल्के वजन वाली स्कोरिंग नीति के डिजाइन और अनुकूलन के विस्तृत स्पष्टीकरण का अभाव।
👍