यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
विश्वास करो, लेकिन सत्यापित करो! परीक्षण-समय स्केलिंग के लिए सत्यापन डिज़ाइन पर एक सर्वेक्षण
Created by
Haebom
लेखक
वी वेंकटेश, मंदीप राठी, अविषेक आनंद
रूपरेखा
यह पत्र बड़े पैमाने पर भाषा मॉडल (एलएलएम) के प्रदर्शन में सुधार के लिए एक नई विधि, टेस्ट-टाइम स्केलिंग (टीटीएस) में सत्यापनकर्ता और विभिन्न दृष्टिकोणों की भूमिका का सर्वेक्षण करता है। टीटीएस अनुमान प्रक्रिया के दौरान अधिक कम्प्यूटेशनल संसाधनों का उपयोग करके एलएलएम की अनुमान प्रक्रिया और कार्य प्रदर्शन में सुधार करता है। सत्यापनकर्ता एक रिवॉर्ड मॉडल के रूप में कार्य करता है जो डिकोडिंग प्रक्रिया के दौरान उत्पन्न उम्मीदवार आउटपुट का मूल्यांकन करता है और इष्टतम आउटपुट का चयन करता है। यह अपने पैरामीटर-मुक्त स्केलिंग और उच्च प्रदर्शन के कारण एक आशाजनक दृष्टिकोण के रूप में उभरा है। यह पत्र विभिन्न सत्यापन विधियों और पिछले अध्ययनों में प्रस्तुत उनके प्रशिक्षण तंत्रों पर एक एकीकृत परिप्रेक्ष्य प्रस्तुत करता है, जिसमें विभिन्न प्रकार के सत्यापनकर्ताओं को शामिल किया गया है ,
Takeaways, Limitations
•
Takeaways:
◦
टीटीएस में सत्यापनकर्ताओं की भूमिका और महत्व को व्यवस्थित रूप से व्यवस्थित करके और विभिन्न दृष्टिकोणों को एकीकृत तरीके से प्रस्तुत करके, हम टीटीएस अनुसंधान की व्यापक समझ प्रदान करते हैं।
◦
टीटीएस में सत्यापनकर्ताओं के प्रशिक्षण विधियों, प्रकारों और उपयोगिता के बारे में जानकारी प्रदान करता है।
◦
प्रदान किए गए कोड भंडार के माध्यम से टीटीएस अनुसंधान की पुनरुत्पादनशीलता और उन्नति में योगदान करें।
•
Limitations:
◦
यह पत्र एक सर्वेक्षण पत्र है और इसमें कोई नई पद्धति प्रस्तुत नहीं की गई है।
◦
सत्यापनकर्ता के निष्पादन मूल्यांकन का विस्तृत विश्लेषण का अभाव हो सकता है।
◦
विभिन्न सत्यापन विधियों के सापेक्ष फायदे और नुकसान का अधिक गहन तुलनात्मक विश्लेषण आवश्यक है।