[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

UPCORE: संतुलित अनलर्निंग के लिए उपयोगिता-संरक्षण कोरसेट चयन

Created by
  • Haebom

लेखक

वैदेही पाटिल, इलियास स्टेंगल-एस्किन, मोहित बंसल

रूपरेखा

इस पत्र में, हम अनलर्निंग प्रक्रिया के दौरान होने वाले प्रदर्शन ह्रास को दूर करने के लिए एक उपयोगिता-संरक्षण कोरसेट चयन (UPCORE) ढाँचा प्रस्तावित करते हैं, जिसमें पूर्व-प्रशिक्षित मॉडल से कुछ डेटा बिंदुओं को हटाना या "भूलना" शामिल है, विशेष रूप से बड़े पैमाने के भाषा मॉडल (LLM) में। UPCORE, मॉडल के निरूपणों के प्रसरण से सहसंबद्ध भूल-सेट से आउटलायर्स को हटाकर अनलर्निंग के बाद मॉडल प्रदर्शन ह्रास को कम करता है। तीन मानक अनलर्निंग विधियों में, UPCORE डेटा विलोपन प्रभावशीलता और मॉडल प्रदर्शन संरक्षण के परस्पर विरोधी लक्ष्यों को प्रभावी ढंग से संतुलित करता है, और हम इसे एक नए AUC-आधारित मूल्यांकन मीट्रिक का उपयोग करके प्रदर्शित करते हैं। UPCORE कोरसेट और हटाए गए डेटा बिंदुओं के बीच सकारात्मक स्थानांतरण को बढ़ावा देकर और हटाए गए डेटा बिंदुओं से अन्य डेटा बिंदुओं पर नकारात्मक स्थानांतरण को कम करके प्रदर्शन में सुधार करता है।

Takeaways, Limitations

Takeaways:
हम UPCORE प्रस्तुत करते हैं, जो एक प्रभावी डेटा चयन ढांचा है जो अनलर्निंग के दौरान मॉडल प्रदर्शन में गिरावट को न्यूनतम करता है।
मॉडल भ्रष्टाचार और प्रतिनिधित्व भिन्नता के बीच संबंध को उजागर करके, हम अनलर्निंग रणनीतियों में सुधार करने के लिए अंतर्दृष्टि प्रदान करते हैं।
हम एक नया AUC-आधारित मूल्यांकन मीट्रिक प्रस्तुत करते हैं जो डेटा विलोपन प्रभावशीलता और मॉडल प्रदर्शन को बनाए रखने के बीच संतुलन को मापता है।
विभिन्न अनलर्निंग विधियों पर लागू कार्यप्रणाली के साथ सामान्यता सुनिश्चित करें।
Limitations:
प्रस्तावित विधि की प्रभावशीलता को प्रयोगात्मक रूप से सत्यापित किया गया है, लेकिन विभिन्न मॉडल आर्किटेक्चर और डेटासेट पर अतिरिक्त प्रयोगों की आवश्यकता है।
चूंकि इस पत्र में AUC-आधारित मूल्यांकन सूचकांक नया प्रस्तावित किया गया है, इसलिए अन्य अध्ययनों में अतिरिक्त सत्यापन की आवश्यकता है।
UPCORE की कम्प्यूटेशनल जटिलता और दक्षता के विश्लेषण का अभाव।
वास्तविक दुनिया के बड़े पैमाने के एलएलएम पर लागू होने पर उत्पन्न होने वाली मापनीयता संबंधी समस्याओं पर विचार का अभाव।
👍