यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
यह पत्र एआई सेवा परिवेशों में कुशल क्वेरी रूटिंग की समस्या के समाधान के लिए मॉडल्स एंड एजेंट्स (MoMA) के मिश्रण (मिक्सचर ऑफ मॉडल्स एंड एजेंट्स) फ्रेमवर्क का प्रस्ताव करता है, जो बड़े पैमाने के भाषा मॉडल (LLM) और डोमेन-विशिष्ट AI एजेंटों के विकास के कारण तेजी से विविध और जटिल होते जा रहे हैं। MoMA सटीक आशय पहचान और एक अनुकूली रूटिंग रणनीति के माध्यम से विविध प्रश्नों को कुशलतापूर्वक संसाधित करने के लिए LLM और एजेंट-आधारित रूटिंग को एकीकृत करता है। विभिन्न LLM के प्रदर्शन का विवरण देने वाले एक विस्तृत प्रशिक्षण डेटासेट का निर्माण करके, यह प्रत्येक LLM के लिए सबसे उपयुक्त कार्यों की पहचान करता है और अनुमान के दौरान उच्चतम लागत-प्रदर्शन दक्षता के साथ LLM को गतिशील रूप से क्वेरीज़ रूट करता है। इसके अलावा, यह संदर्भ-जागरूक स्टेट मशीन और डायनेमिक मास्किंग पर आधारित एक कुशल एजेंट चयन रणनीति प्रस्तुत करता है।
Takeaways, Limitations
•
Takeaways:
◦
हम एक नवीन रूटिंग फ्रेमवर्क प्रस्तुत करते हैं जो विभिन्न एलएलएम और एजेंटों का कुशलतापूर्वक उपयोग करता है।
◦
गतिशील रूटिंग रणनीतियों के माध्यम से दक्षता बढ़ाएं जो लागत-प्रदर्शन संतुलन को अनुकूलित करती हैं।
◦
संदर्भ-जागरूक राज्य मशीनों और गतिशील मास्किंग का उपयोग करते हुए एक प्रभावी एजेंट चयन रणनीति प्रस्तुत की गई है।
◦
प्रयोगों से MoMA की बेहतर लागत-प्रभावशीलता और मापनीयता प्रदर्शित होती है।
•
Limitations:
◦
प्रस्तावित MoMA फ्रेमवर्क के वास्तविक विश्व सेवा वातावरण में अनुप्रयोग और दीर्घकालिक स्थिरता का अतिरिक्त सत्यापन आवश्यक है।
◦
विभिन्न प्रकार के प्रश्नों के लिए सामान्यीकरण प्रदर्शन का मूल्यांकन और सुधार करने की आवश्यकता है।
◦
MoMA प्रदर्शन पर प्रशिक्षण डेटासेट की गुणवत्ता और आकार के प्रभाव को निर्धारित करने के लिए आगे के विश्लेषण की आवश्यकता है।
◦
विशिष्ट डोमेन या कार्य प्रकारों के लिए पक्षपातपूर्ण परिणामों की संभावना पर विचार किया जाना चाहिए।