दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

रेडियो विनियमों की विश्वसनीय व्याख्या के लिए पुनर्प्राप्ति-संवर्धित पीढ़ी

Created by
  • Haebom

लेखक

ज़कारिया एल कासिमी, फारेस फोराती, मोहम्मद-स्लिम अलौनी

रूपरेखा

यह शोधपत्र रेडियो विनियमन के कानूनी रूप से संवेदनशील और महत्वपूर्ण क्षेत्र में प्रश्नोत्तर का अध्ययन करता है। हम एक दूरसंचार-विशिष्ट खोज संवर्धित उत्पादन (RAG) पाइपलाइन का प्रस्ताव करते हैं और इस क्षेत्र के लिए पहला बहुविकल्पीय मूल्यांकन सेट प्रस्तुत करते हैं, जिसे स्वचालित फ़िल्टरिंग और मानव सत्यापन का उपयोग करके आधिकारिक स्रोतों से निर्मित किया गया है। हम पुनर्प्राप्ति गुणवत्ता का मूल्यांकन करने के लिए एक डोमेन-विशिष्ट पुनर्प्राप्ति मीट्रिक परिभाषित करते हैं और प्रदर्शित करते हैं कि पुनर्प्राप्ति प्रणाली इस मीट्रिक के अंतर्गत लगभग 97% सटीकता प्राप्त करती है। पुनर्प्राप्ति के अलावा, प्रस्तावित दृष्टिकोण सभी परीक्षण किए गए मॉडलों में उत्पादन सटीकता में लगातार सुधार करता है। उल्लेखनीय रूप से, जबकि संरचित पुनर्प्राप्ति के बिना केवल दस्तावेज़ों को एम्बेड करने से GPT-4o के लिए केवल मामूली लाभ (1% से कम) प्राप्त होता है, प्रस्तावित पाइपलाइन को लागू करने से लगभग 12% का सापेक्ष सुधार प्राप्त होता है। ये परिणाम प्रदर्शित करते हैं कि सावधानीपूर्वक लक्षित साक्ष्य नियामक प्रश्नोत्तर के लिए एक सरल लेकिन शक्तिशाली मानक और एक प्रभावी डोमेन-विशिष्ट समाधान प्रदान करते हैं। सभी कोड, मूल्यांकन स्क्रिप्ट और व्युत्पन्न प्रश्नोत्तर डेटासेट https://github.com/Zakaria010/Radio-RAG पर उपलब्ध हैं ।

Takeaways, Limitations

Takeaways:
हम प्रदर्शित करते हैं कि संचार-विशिष्ट RAG पाइपलाइन रेडियो विनियमन प्रश्न-उत्तर की सटीकता में महत्वपूर्ण रूप से सुधार करती है।
डोमेन-विशिष्ट खोज मेट्रिक्स और वस्तुनिष्ठ मूल्यांकन का एक सेट प्रस्तुत करके भविष्य के अनुसंधान में योगदान देता है।
यह सिद्ध करना कि सावधानीपूर्वक लक्षित साक्ष्य विनियामक प्रश्नों का उत्तर देने में प्रभावी है।
पुनरुत्पादन और आगे के अनुसंधान को समर्थन देने के लिए सभी कोड और डेटासेट सार्वजनिक किए गए हैं।
Limitations:
यद्यपि मूल्यांकन सेट का निर्माण आधिकारिक स्रोतों से किया गया था, फिर भी इसके आकार और विविधता का स्पष्ट उल्लेख नहीं किया गया था।
GPT-4o के अलावा अन्य मॉडलों का विश्लेषण सीमित हो सकता है।
डोमेन-विशिष्ट खोज मेट्रिक्स की सामान्यता पर आगे अनुसंधान की आवश्यकता है।
👍