[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

THOR: ऑन-डिमांड पुनर्प्राप्ति के लिए ट्रांसफॉर्मर ह्यूरिस्टिक्स

Created by
  • Haebom

लेखक

इसहाक शि, ज़ेयुआन ली, फैन लियू, वेनली वांग, लेवेई हे, यांग यांग, तियानयु शि

रूपरेखा

ESapiens द्वारा विकसित ट्रांसफ़ॉर्मर ह्यूरिस्टिक्स फ़ॉर ऑन-डिमांड रिट्रीवल (THOR) मॉड्यूल एक सुरक्षित और स्केलेबल इंजन है जो प्राकृतिक भाषा के प्रश्नों को मान्य रीड-ओनली SQL एनालिटिक्स क्वेरीज़ में बदल देता है। एक अलग ऑर्केस्ट्रेशन/निष्पादन आर्किटेक्चर पर आधारित, पर्यवेक्षी एजेंट क्वेरीज़ को रूट करता है, स्कीमा डिस्कवरी गतिशील रूप से तालिका और कॉलम मेटाडेटा इंजेक्ट करती है, और SQL जनरेशन एजेंट रीड-ओनली सुरक्षा उपायों द्वारा सुरक्षित सिंगल-स्टेटमेंट SELECT क्वेरीज़ जनरेट करता है। एकीकृत स्व-सुधार और मूल्यांकन लूप रिक्त परिणामों, निष्पादन त्रुटियों या खराब-गुणवत्ता वाले आउटपुट का पता लगाता है और LLM-आधारित पुनर्जनन का पाँच बार तक प्रयास करता है। अंत में, परिणाम व्याख्या एजेंट संक्षिप्त, मानव-पठनीय अंतर्दृष्टि उत्पन्न करता है और दृश्य या पूर्वानुमान के लिए इनसाइट्स और इंटेलिजेंस इंजन को कच्ची पंक्तियाँ भेजता है। वित्तीय, बिक्री और परिचालन परिदृश्यों के लिए स्मोक टेस्ट विश्वसनीय एड-हॉक क्वेरीज़ और स्वचालित आवधिक रिपोर्टिंग प्रदर्शित करते हैं। स्कीमा जागरूकता, दोष-सहिष्णु निष्पादन और अनुपालन सुरक्षा उपायों को शामिल करके, THOR मॉड्यूल गैर-तकनीकी उपयोगकर्ताओं को SQL के बिना लाइव डेटा तक सुरक्षित रूप से पहुँचने में सक्षम बनाता है।

Takeaways, Limitations

Takeaways:
गैर-तकनीकी उपयोगकर्ताओं के लिए डेटा पहुंच में सुधार करने के लिए प्राकृतिक भाषा के प्रश्नों को SQL क्वेरीज़ में अनुवाद करें।
केवल पढ़ने के लिए सुरक्षा के साथ डेटा सुरक्षा को बढ़ाएँ।
स्व-सुधार और मूल्यांकन लूप के माध्यम से क्वेरी निष्पादन की विश्वसनीयता बढ़ाता है।
विभिन्न व्यावसायिक परिदृश्यों (वित्त, बिक्री, संचालन) पर लागू।
स्वचालित आवधिक रिपोर्टिंग क्षमताएं प्रदान करता है।
Limitations:
एलएलएम-आधारित पुनर्जनन में सीमाओं के कारण, कुछ जटिल प्रश्नों की सटीकता कम हो सकती है।
सिस्टम का प्रदर्शन स्कीमा पहचान की सटीकता पर निर्भर हो सकता है।
बड़े डेटासेट पर प्रदर्शन और मापनीयता का और अधिक सत्यापन आवश्यक है।
वर्तमान में समर्थित डेटाबेस प्रकारों और स्कीमाओं की विविधता के बारे में जानकारी का अभाव।
वास्तविक परिचालन वातावरण में दीर्घकालिक स्थिरता और रखरखाव की समीक्षा की जानी चाहिए।
👍