यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
यह शोधपत्र प्रासंगिक अधिगम में एक क्वेरी सेट के लिए प्रदर्शन उदाहरणों के चयन हेतु एक एल्गोरिथ्म प्रस्तुत करता है। हम N उदाहरणों के एक समूह में से k उदाहरणों का चयन करके उन्हें अनुप्रवाह अनुमान के लिए शर्तों के रूप में उपयोग करने का तरीका बताते हैं। मौजूदा टोकन एम्बेडिंग समानता-आधारित विधियों के विपरीत, यह शोधपत्र एक नवीन दृष्टिकोण प्रस्तावित करता है जो इनपुट एम्बेडिंग स्पेस में आउटपुट के ग्रेडिएंट का उपयोग करता है। हम ग्रेडिएंट का उपयोग करके प्रथम-क्रम सन्निकटन के माध्यम से मॉडल आउटपुट का अनुमान लगाते हैं और इस अनुमान को कई यादृच्छिक रूप से चुने गए उपसमुच्चयों पर लागू करते हैं। हम प्रत्येक प्रदर्शन के लिए एक प्रभाव स्कोर की गणना करते हैं और k सबसे प्रासंगिक उदाहरणों का चयन करते हैं। चूँकि मॉडल आउटपुट और ग्रेडिएंट की केवल एक बार पूर्व-गणना करने की आवश्यकता होती है, इसलिए एल्गोरिथ्म मॉडल और प्रशिक्षण सेट आकारों के संबंध में रैखिक समय में कार्य करता है। विभिन्न मॉडलों और डेटासेट पर व्यापक प्रयोग इसकी दक्षता को प्रदर्शित करते हैं। ग्रेडिएंट अनुमान प्रक्रिया छह डेटासेट पर 1% से कम त्रुटि के साथ पूर्ण अनुमान का अनुमान लगाती है। यह मौजूदा विधियों की तुलना में 37.7 गुना तेज़ उपसमुच्चय चयन को सक्षम बनाता है और मौजूदा इनपुट एम्बेडिंग-आधारित चयन विधियों की तुलना में औसतन 11% सुधार प्रदान करता है।
Takeaways, Limitations
•
Takeaways:
◦
हम एक डेमो उदाहरण चयन एल्गोरिथम प्रस्तुत करते हैं जो इनपुट एम्बेडिंग-आधारित विधियों की तुलना में अधिक कुशल है और बेहतर प्रदर्शन करता है।
◦
ग्रेडिएंट-आधारित अनुमान के माध्यम से पूर्ण अनुमान के लिए सटीक अनुमान प्रदान करता है।
◦
बड़े पैमाने के मॉडल के लिए भी, शीघ्रता और कुशलता से डेमो उदाहरणों का चयन करें।
◦
इसका उपयोग विभिन्न अनुप्रयोगों जैसे शीघ्र ट्यूनिंग और विचार श्रृंखला अनुमान में किया जा सकता है।
•
Limitations:
◦
चूंकि ग्रेडिएंट-आधारित आकलन प्रथम-क्रम सन्निकटन पर निर्भर करता है, इसलिए जटिल मॉडल या डेटासेट में त्रुटियाँ बढ़ सकती हैं।
◦
एल्गोरिथ्म की दक्षता मॉडल आउटपुट और ग्रेडिएंट्स की पूर्व-गणना पर निर्भर करती है, जिसके लिए महत्वपूर्ण कम्प्यूटेशनल संसाधनों की आवश्यकता हो सकती है।
◦
विशिष्ट मॉडल और डेटासेट को अनुकूलित करने के लिए हाइपरपैरामीटर ट्यूनिंग की आवश्यकता हो सकती है।