दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

संदर्भ-संरेखित पुनर्प्राप्ति-विषम स्वामित्व दस्तावेजों पर संवर्धित प्रश्नोत्तर

Created by
  • Haebom

लेखक

नायॉन्ग चोई, ग्रेस ब्यून, एंड्रयू चुंग, ऐली एस. पेक, शिनसुन ली, जिन्हो डी. चोई

रूपरेखा

यह शोधपत्र आंतरिक कॉर्पोरेट दस्तावेज़ों की विशाल मात्रा और असंरचित प्रकृति के कारण सूचना तक पहुँच की चुनौतियों का समाधान करने के लिए एक पुनर्प्राप्ति-संवर्धित पीढ़ी (RAG)-आधारित प्रश्न-उत्तर (QA) प्रणाली का प्रस्ताव करता है। ऑटोमोटिव उद्योग के क्रैश टेस्ट दस्तावेज़ों को एक उदाहरण के रूप में उपयोग करते हुए, हम विविध प्रकार के डेटा को संसाधित करने, डेटा गोपनीयता बनाए रखने और उत्पन्न उत्तरों और मूल दस्तावेज़ों के बीच पता लगाने की क्षमता सुनिश्चित करने पर ध्यान केंद्रित करते हैं। इसे प्राप्त करने के लिए, हम RAG-QA ढाँचा प्रस्तुत करते हैं, जिसमें एक डेटा पाइपलाइन शामिल है जो विभिन्न प्रकार के दस्तावेज़ों को एक संरचित कॉर्पस और QA युग्मों में परिवर्तित करती है, एक आंतरिक गोपनीयता-संरक्षण वास्तुकला, और एक हल्का संदर्भ मिलानकर्ता जो उत्तरों को सहायक सामग्री से जोड़ता है। हमारे प्रयोगात्मक परिणाम ऑटोमोटिव उद्योग में लागू होने पर मौजूदा प्रणालियों की तुलना में तथ्यात्मक सटीकता, सूचनात्मकता और उपयोगिता में सुधार प्रदर्शित करते हैं।

Takeaways, Limitations

Takeaways:
आंतरिक कॉर्पोरेट दस्तावेजों के उपयोग के लिए एक प्रभावी RAG-QA ढांचा प्रस्तुत करना।
विभिन्न प्रकार के डेटा (मल्टीमॉडल) के प्रसंस्करण और गोपनीयता बनाए रखने के लिए कार्यों को कार्यान्वित करना
उत्पन्न उत्तरों की पता लगाने योग्यता सुनिश्चित करके विश्वसनीयता में सुधार
ऑटोमोटिव उद्योग सहित विभिन्न उद्योगों में सूचना की सुलभता और निर्णय लेने की दक्षता में सुधार की संभावना का सुझाव देना।
मानव और एलएलएम मूल्यांकनकर्ताओं के माध्यम से प्रदर्शन को मापकर विश्वसनीयता में सुधार
Limitations:
प्रस्तावित ढांचा ऑटोमोटिव उद्योग के लिए विशिष्ट है, तथा अन्य उद्योगों में लागू करने पर इसे और अधिक सत्यापन की आवश्यकता होगी।
प्रणाली निर्माण और रखरखाव की लागत और संसाधन खपत पर विचार किया जाना चाहिए।
बड़े पैमाने पर डेटा प्रोसेसिंग के लिए मापनीयता और संभावित प्रदर्शन में गिरावट
एलएलएम मूल्यांकनकर्ताओं की विश्वसनीयता की आगे समीक्षा की आवश्यकता है।
विभिन्न प्रकार के मल्टीमॉडल डेटा के लिए सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।
👍