दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ओब्लिविएट: बड़े भाषा मॉडल के लिए मजबूत और व्यावहारिक मशीन अनलर्निंग

Created by
  • Haebom

लेखक

ज़ियाओयू जू, मिनक्सिन डू, किंगकिंग ये, हाइबो हू

रूपरेखा

यह पत्र संवेदनशील, कॉपीराइट या अन्यथा आपत्तिजनक सामग्री को याद रखने वाले विशाल डेटासेट पर प्रशिक्षित बड़े पैमाने पर भाषा मॉडल (एलएलएम) की समस्या को हल करने के लिए एक मजबूत अनलर्निंग फ्रेमवर्क, ओब्लिविएट का प्रस्ताव करता है। ओब्लिविएट तीन घटकों से युक्त कस्टम लॉस फ़ंक्शन का उपयोग करके लक्ष्य टोकन निष्कर्षण, रखरखाव डेटासेट निर्माण और फ़ाइन-ट्यूनिंग की एक संरचित प्रक्रिया का पालन करता है: मास्किंग, ज्ञान आसवन और विश्व ज्ञान। यह अनलर्निंग गुणवत्ता से समझौता किए बिना दक्षता बनाए रखने के लिए एक निम्न-रैंक एडाप्टर (LoRA) का उपयोग करता है। हैरी पॉटर श्रृंखला, WMDP और TOFU सहित विभिन्न डेटासेट पर प्रयोग किए जाते हैं, जिसमें एक उपन्यास दस्तावेज़-स्तरीय रिकॉल स्कोर सहित भूलने की गुणवत्ता, मॉडल उपयोगिता और प्रवाह जैसे व्यापक मैट्रिक्स का उपयोग किया जाता है।

Takeaways, Limitations

Takeaways:
बड़े पैमाने पर भाषा मॉडल में संवेदनशील जानकारी को याद रखने की समस्या का एक प्रभावी समाधान।
ओब्लिविएट फ्रेमवर्क कॉपीराइट और हानिकारक सामग्री संबंधी मुद्दों को संबोधित करने की क्षमता प्रस्तुत करता है।
LoRA का उपयोग करके कुशल अनलर्निंग को लागू करना
नए दस्तावेज़-स्तरीय मेमोरी स्कोर सहित व्यापक मूल्यांकन मीट्रिक
विभिन्न डेटासेट और मेट्रिक्स का उपयोग करके प्रयोगों के माध्यम से मजबूत प्रदर्शन सत्यापन।
Limitations:
विशिष्ट LoRA कार्यान्वयन विवरण और हाइपरपैरामीटर अनुकूलन प्रक्रिया के विस्तृत स्पष्टीकरण का संभावित अभाव
विभिन्न प्रकार की संवेदनशील जानकारी और हानिकारक सामग्री के लिए सामान्यीकरण प्रदर्शन का सत्यापन आवश्यक है।
अतिरिक्त मुद्दे जो वास्तविक सेवा वातावरण पर लागू करते समय उत्पन्न हो सकते हैं और Limitations के अपर्याप्त विचार की संभावना
बड़े पैमाने के मॉडलों पर लागू होने पर कम्प्यूटेशनल लागत और समय के विश्लेषण की संभावित कमी
👍