यह शोधपत्र आंतरिक कॉर्पोरेट दस्तावेज़ों की विशाल मात्रा और असंरचित प्रकृति के कारण सूचना तक पहुँच की चुनौतियों का समाधान करने के लिए एक पुनर्प्राप्ति-संवर्धित पीढ़ी (RAG)-आधारित प्रश्न-उत्तर (QA) प्रणाली का प्रस्ताव करता है। ऑटोमोटिव उद्योग के क्रैश टेस्ट दस्तावेज़ों को एक उदाहरण के रूप में उपयोग करते हुए, हम विविध प्रकार के डेटा को संसाधित करने, डेटा गोपनीयता बनाए रखने और उत्पन्न उत्तरों और मूल दस्तावेज़ों के बीच पता लगाने की क्षमता सुनिश्चित करने पर ध्यान केंद्रित करते हैं। इसे प्राप्त करने के लिए, हम RAG-QA ढाँचा प्रस्तुत करते हैं, जिसमें एक डेटा पाइपलाइन शामिल है जो विभिन्न प्रकार के दस्तावेज़ों को एक संरचित कॉर्पस और QA युग्मों में परिवर्तित करती है, एक आंतरिक गोपनीयता-संरक्षण वास्तुकला, और एक हल्का संदर्भ मिलानकर्ता जो उत्तरों को सहायक सामग्री से जोड़ता है। हमारे प्रयोगात्मक परिणाम ऑटोमोटिव उद्योग में लागू होने पर मौजूदा प्रणालियों की तुलना में तथ्यात्मक सटीकता, सूचनात्मकता और उपयोगिता में सुधार प्रदर्शित करते हैं।