दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

जोड़ीदार रैंकिंग के माध्यम से पोस्ट हॉक रिग्रेशन परिशोधन

Created by
  • Haebom

लेखक

केविन तीर्थ विजया, माइकल सन, मिंगहाओ गुओ, हंस-पीटर सीडेल, वोज्शिएक माटुसिक, वाहिद बाबाई

रूपरेखा

यह शोधपत्र RankRefine का प्रस्ताव करता है, जो एक मॉडल-स्वतंत्र पोस्ट-प्रोसेसिंग विधि है जो डेटा-विहीन परिवेशों में निरंतर फ़ीचर पूर्वानुमान की सटीकता में सुधार करती है। RankRefine, एक आधार समाश्रयण मॉडल के आउटपुट को व्युत्क्रम वितरित भारों का उपयोग करके युग्मित रैंक-आधारित अनुमानों के साथ संयोजित करता है। यह अंतर्निहित मॉडल को पुनः प्रशिक्षित किए बिना, क्वेरी आइटम और ज्ञात फ़ीचरों के एक छोटे संदर्भ समूह पर कार्य करता है। एक आणविक फ़ीचर पूर्वानुमान कार्य में, हम प्रदर्शित करते हैं कि एक पूर्व-प्रशिक्षित वृहद-स्तरीय भाषा मॉडल (LLM) के साथ केवल 20 युग्मित तुलनाओं का उपयोग करने से माध्य निरपेक्ष त्रुटि 10% तक कम हो जाती है। हम प्रदर्शित करते हैं कि विशेषज्ञ या सामान्य-उद्देश्य वाले LLM द्वारा प्रदान की गई रैंकिंग जानकारी अकेले ही विभिन्न क्षेत्रों में समाश्रयण प्रदर्शन में सुधार कर सकती है, जो व्यावहारिकता और व्यापक प्रयोज्यता को प्रदर्शित करती है, विशेष रूप से डेटा-विहीन परिवेशों में।

Takeaways, Limitations

Takeaways:
हम डेटा-विहीन वातावरण में निरंतर फीचर भविष्यवाणी की सटीकता में सुधार करने के लिए एक प्रभावी पोस्टप्रोसेसिंग विधि प्रस्तुत करते हैं।
यह कुशल है क्योंकि यह मॉडल पुनःप्रशिक्षण के बिना केवल दो-तरफ़ा रैंकिंग जानकारी का उपयोग करके प्रदर्शन में सुधार कर सकता है।
रैंकिंग संबंधी जानकारी अत्यधिक उपयोगी है क्योंकि इसे न केवल विशेषज्ञ ज्ञान के माध्यम से प्राप्त किया जा सकता है, बल्कि एलएलएम जैसे सामान्य उपकरणों के माध्यम से भी प्राप्त किया जा सकता है।
इसकी विभिन्न क्षेत्रों में सार्वभौमिक प्रयोज्यता है।
Limitations:
प्रस्तावित विधि का प्रदर्शन सुधार एक विशिष्ट डेटासेट (आणविक गुण पूर्वानुमान) तक सीमित हो सकता है। अन्य डेटासेट पर इसकी सामान्यता निर्धारित करने के लिए आगे सत्यापन की आवश्यकता है।
एलएलएम के माध्यम से प्राप्त रैंकिंग जानकारी की गुणवत्ता से प्रदर्शन प्रभावित हो सकता है। एलएलएम की विश्वसनीयता और सीमाओं पर विचार किया जाना चाहिए।
जब युग्मित तुलनाओं की संख्या सीमित हो, तो प्रदर्शन लाभ सीमित हो सकते हैं। तुलनाओं की इष्टतम संख्या निर्धारित करने के लिए और अधिक शोध की आवश्यकता है।
👍