[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

RAG-R1: बहु-प्रश्न समानांतरवाद के माध्यम से LLMs की खोज और तर्क क्षमताओं को प्रोत्साहित करना

Created by
  • Haebom

लेखक

ज़ीवेन टैन, जियामिंग हुआंग, क्विंटोंग वू, होंगक्सुआन झांग, चेनयी ज़ुआंग, जिंजी गु

रूपरेखा

बड़े पैमाने के भाषा मॉडल (LLM) की सीमाओं को दूर करने के लिए, जो स्थिर आंतरिक ज्ञान के कारण भ्रमकारी या कालभ्रमित प्रतिक्रियाएँ उत्पन्न करते हैं, यह शोधपत्र एक बेहतर सुदृढीकरण अधिगम (RL)-आधारित पुनर्प्राप्ति-संवर्धित निर्माण (RAG) ढाँचा प्रस्तावित करता है, जिसे RAG-R1 कहा जाता है। RAG-R1 को अनुमान प्रक्रिया के दौरान आंतरिक और बाह्य ज्ञान का अनुकूली उपयोग करने के लिए डिज़ाइन किया गया है, और यह निर्माण और पुनर्प्राप्ति प्रक्रियाओं को एकल-प्रश्न मोड से बहु-प्रश्न समानांतर प्रसंस्करण तक विस्तारित करता है ताकि अनुमान समय कम हो और मॉडल का प्रदर्शन बेहतर हो। सात प्रश्न-उत्तर मानकों पर प्रायोगिक परिणाम दर्शाते हैं कि प्रस्तावित विधि अत्याधुनिक आधारभूत मॉडलों की तुलना में 13.2% तक बेहतर प्रदर्शन करती है और अनुमान समय को 11.1% तक कम करती है।

Takeaways, Limitations

Takeaways:
हम सुदृढीकरण सीखने पर आधारित आरएजी के माध्यम से एलएलएम की अनुमान क्षमता और प्रदर्शन में सुधार की संभावना प्रस्तुत करते हैं।
हमने बहु-क्वेरी समानांतर प्रसंस्करण के माध्यम से अनुमान समय को कम करने और दक्षता बढ़ाने की संभावना को सत्यापित किया।
विभिन्न प्रश्न-उत्तर मानकों में मौजूदा सर्वोत्तम प्रदर्शन करने वाले मॉडलों की तुलना में प्रयोगात्मक रूप से सत्यापित प्रदर्शन सुधार।
Limitations:
आरएजी-आर1 के सामान्यीकरण प्रदर्शन और विभिन्न कार्यों में इसकी प्रयोज्यता पर आगे अनुसंधान की आवश्यकता है।
बहु-क्वेरी समानांतर प्रसंस्करण की मापनीयता और जटिलता पर आगे विश्लेषण की आवश्यकता है।
ये एक विशिष्ट बेंचमार्क के लिए परिणाम हैं, तथा अन्य डोमेन या कार्यों के लिए सामान्यीकरण हेतु आगे सत्यापन की आवश्यकता है।
👍