दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

कुशल RAG के लिए गतिशील संदर्भ संपीड़न

Created by
  • Haebom

लेखक

शुयू गुओ, झाओचुन रेन

रूपरेखा

यह शोधपत्र पुनर्प्राप्ति-संवर्धित निर्माण (RAG) में उच्च अनुमान लागत की समस्या के समाधान हेतु एक अनुकूली संदर्भ संपीड़न (ACC-RAG) ढाँचा प्रस्तावित करता है। मौजूदा निश्चित-दर संपीड़न विधियों के विपरीत, ACC-RAG इनपुट प्रश्न की जटिलता के अनुसार संपीड़न अनुपात को गतिशील रूप से समायोजित करता है, जिससे दक्षता और सटीकता दोनों में सुधार होता है। एक पदानुक्रमित संपीड़क और एक संदर्भ चयनकर्ता को मिलाकर, यह केवल न्यूनतम आवश्यक जानकारी ही रखता है, जो मानव-स्कैनिंग प्रक्रिया का अनुकरण करता है। विकिपीडिया और पाँच प्रश्न-उत्तर (QA) डेटासेट का उपयोग करके प्राप्त प्रायोगिक परिणाम दर्शाते हैं कि ACC-RAG मौजूदा निश्चित-दर संपीड़न विधियों से बेहतर प्रदर्शन करता है, मानक RAG की तुलना में चार गुना से भी अधिक तेज़ अनुमान गति प्राप्त करता है, और सटीकता को बनाए रखता है या उसमें सुधार करता है।

Takeaways, Limitations

Takeaways:
हम आरएजी की अनुमान लागत समस्या को प्रभावी ढंग से संबोधित करने के लिए एक नया दृष्टिकोण प्रस्तुत करते हैं।
दक्षता और सटीकता में संतुलित सुधार प्राप्त करने के लिए इनपुट जटिलता के आधार पर संपीड़न अनुपात को गतिशील रूप से समायोजित करता है।
यह मौजूदा RAG विधि की तुलना में बहुत तेज अनुमान गति प्रदान करता है।
हमने विभिन्न QA डेटासेट पर प्रदर्शन सुधार प्रदर्शित किया है।
Limitations:
प्रस्तावित ACC-RAG के प्रदर्शन में सुधार विशिष्ट डेटासेट और प्रश्न प्रकारों के प्रति पक्षपाती हो सकता है।
पदानुक्रमित कम्प्रेसर और संदर्भ चयनकर्ताओं का डिज़ाइन जटिल है और इसे क्रियान्वित करना और अनुकूलित करना कठिन हो सकता है।
वास्तविक दुनिया के बड़े पैमाने के अनुप्रयोग वातावरण में प्रदर्शन और मापनीयता पर आगे अनुसंधान की आवश्यकता है।
👍