दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

पैरामीट्रिक-पुनर्प्राप्त ज्ञान तालमेल के लिए सहयोगी एजेंट श्रृंखला

Created by
  • Haebom

लेखक

यी जियांग, सेंडोंग झाओ, जियानबो ली, हाओचुन वांग, लिझे झांग, यान लियू, बिंग किन

रूपरेखा

यह पत्र रिट्रीवल ऑगमेंटेड जेनरेशन (RAG) की चुनौती का समाधान करने के लिए सहयोगी एजेंट श्रृंखला (CoCoA) फ्रेमवर्क का प्रस्ताव करता है, जो ज्ञान-गहन कार्यों में बड़े पैमाने पर भाषा मॉडल (LLM) के प्रदर्शन में सुधार के लिए एक आशाजनक फ्रेमवर्क है। मौजूदा RAG विधियाँ मॉडल के आंतरिक पैरामीटर ज्ञान और बाह्य पुनर्प्राप्ति ज्ञान के बीच तालमेल का पूरी तरह से लाभ उठाने में विफल रहती हैं, लेकिन CoCoA एक बहु-एजेंट दृष्टिकोण के माध्यम से इस चुनौती पर विजय प्राप्त करता है। सबसे पहले, हम CoCoA-शून्य प्रस्तुत करते हैं, जो सशर्त ज्ञान प्रेरण के बाद अनुमान लगाता है। इसके आधार पर, हम CoCoA विकसित करते हैं, जो एक विस्तारित बहु-एजेंट अनुमान पथ को संश्लेषित करके LLM को परिष्कृत करता है। प्रायोगिक परिणाम प्रदर्शित करते हैं कि CoCoA-शून्य और CoCoA ओपन-डोमेन और बहु-चरणीय प्रश्न-उत्तर कार्यों में बेहतर प्रदर्शन प्राप्त करते हैं।

Takeaways, Limitations

Takeaways:
हम एक नवीन RAG फ्रेमवर्क (CoCoA) प्रस्तुत करते हैं जो LLM में आंतरिक और बाह्य खोज ज्ञान के बीच तालमेल को स्पष्ट रूप से बढ़ाता है।
बहु-एजेंट दृष्टिकोण अधिक सटीक और कुशल ज्ञान उपयोग की क्षमता प्रस्तुत करता है।
यह खुले-डोमेन और बहु-चरणीय प्रश्न-उत्तर कार्यों में मौजूदा RAG विधियों से बेहतर प्रदर्शन करता है।
CoCoA-शून्य और CoCoA के चरण-दर-चरण विकास के माध्यम से एक प्रभावी मॉडल सीखने की रणनीति प्रस्तुत करना।
Limitations:
प्रस्तावित ढांचे के सामान्यीकरण प्रदर्शन और विभिन्न कार्यों के लिए इसकी प्रयोज्यता का मूल्यांकन करने के लिए आगे अनुसंधान की आवश्यकता है।
CoCoA की कम्प्यूटेशनल लागत और प्रशिक्षण समय के विश्लेषण का अभाव।
केवल एक विशिष्ट डेटासेट के लिए प्रदर्शन मूल्यांकन परिणाम प्रस्तुत किए जाते हैं, इसलिए अन्य डेटासेटों के लिए सामान्यीकरण को सत्यापित करने की आवश्यकता होती है।
👍