दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

सामान्यीकृत रूटिंग की ओर: अनुकूली और कुशल अनुमान के लिए मॉडल और एजेंट ऑर्केस्ट्रेशन

Created by
  • Haebom

लेखक

ज़ियू गुओ, शान वांग, चुनफंग जी, ज़ुएफ़ेंग झाओ, वेनहाओ शी, याओयाओ लियू, क़िंगलान ली, चाओ डेंग, जुनलान फेंग

रूपरेखा

यह पत्र एआई सेवा परिवेशों में कुशल क्वेरी रूटिंग की समस्या के समाधान के लिए मॉडल्स एंड एजेंट्स (MoMA) के मिश्रण (मिक्सचर ऑफ मॉडल्स एंड एजेंट्स) फ्रेमवर्क का प्रस्ताव करता है, जो बड़े पैमाने के भाषा मॉडल (LLM) और डोमेन-विशिष्ट AI एजेंटों के विकास के कारण तेजी से विविध और जटिल होते जा रहे हैं। MoMA सटीक आशय पहचान और एक अनुकूली रूटिंग रणनीति के माध्यम से विविध प्रश्नों को कुशलतापूर्वक संसाधित करने के लिए LLM और एजेंट-आधारित रूटिंग को एकीकृत करता है। विभिन्न LLM के प्रदर्शन का विवरण देने वाले एक विस्तृत प्रशिक्षण डेटासेट का निर्माण करके, यह प्रत्येक LLM के लिए सबसे उपयुक्त कार्यों की पहचान करता है और अनुमान के दौरान उच्चतम लागत-प्रदर्शन दक्षता के साथ LLM को गतिशील रूप से क्वेरीज़ रूट करता है। इसके अलावा, यह संदर्भ-जागरूक स्टेट मशीन और डायनेमिक मास्किंग पर आधारित एक कुशल एजेंट चयन रणनीति प्रस्तुत करता है।

Takeaways, Limitations

Takeaways:
हम एक नवीन रूटिंग फ्रेमवर्क प्रस्तुत करते हैं जो विभिन्न एलएलएम और एजेंटों का कुशलतापूर्वक उपयोग करता है।
गतिशील रूटिंग रणनीतियों के माध्यम से दक्षता बढ़ाएं जो लागत-प्रदर्शन संतुलन को अनुकूलित करती हैं।
संदर्भ-जागरूक राज्य मशीनों और गतिशील मास्किंग का उपयोग करते हुए एक प्रभावी एजेंट चयन रणनीति प्रस्तुत की गई है।
प्रयोगों से MoMA की बेहतर लागत-प्रभावशीलता और मापनीयता प्रदर्शित होती है।
Limitations:
प्रस्तावित MoMA फ्रेमवर्क के वास्तविक विश्व सेवा वातावरण में अनुप्रयोग और दीर्घकालिक स्थिरता का अतिरिक्त सत्यापन आवश्यक है।
विभिन्न प्रकार के प्रश्नों के लिए सामान्यीकरण प्रदर्शन का मूल्यांकन और सुधार करने की आवश्यकता है।
MoMA प्रदर्शन पर प्रशिक्षण डेटासेट की गुणवत्ता और आकार के प्रभाव को निर्धारित करने के लिए आगे के विश्लेषण की आवश्यकता है।
विशिष्ट डोमेन या कार्य प्रकारों के लिए पक्षपातपूर्ण परिणामों की संभावना पर विचार किया जाना चाहिए।
👍