दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एमईरेज़र: बड़े भाषा मॉडलों के लिए एक प्रभावी फ़िंगरप्रिंट मिटाने का तरीका

Created by
  • Haebom

लेखक

जिंगक्सुआन झांग, झेनहुआ ​​जू, रुई हू, वेनपेंग जिंग, ज़ुहोंग झांग, मेंग हान

रूपरेखा

यह शोधपत्र मिसमैच्ड इरेज़र (MEraser) प्रस्तुत करता है, जो बड़े पैमाने के भाषा मॉडल (LLM) में स्वामित्व और बौद्धिक संपदा संरक्षण से जुड़ी चिंताओं को दूर करने के लिए एक बैकडोर-आधारित फ़िंगरप्रिंटिंग तकनीक है। MEraser, बेमेल और सामान्य डेटासेट का उपयोग करते हुए, दो-चरणीय फ़ाइन-ट्यूनिंग रणनीति के माध्यम से मॉडल के प्रदर्शन को बनाए रखते हुए बैकडोर-आधारित फ़िंगरप्रिंट को प्रभावी ढंग से हटाता है। विभिन्न LLM आर्किटेक्चर और फ़िंगरप्रिंटिंग विधियों के व्यापक मूल्यांकन के माध्यम से, हम प्रदर्शित करते हैं कि MEraser 1,000 से कम नमूनों वाले छोटे प्रशिक्षण डेटासेट के साथ भी मॉडल के प्रदर्शन को बनाए रखते हुए पूर्ण फ़िंगरप्रिंटिंग प्राप्त करता है। इसके अलावा, हम एक हस्तांतरणीय इरेज़र तंत्र प्रस्तुत करते हैं जो विभिन्न मॉडलों में बार-बार प्रशिक्षण के बिना प्रभावी फ़िंगरप्रिंटिंग को सक्षम बनाता है। निष्कर्षतः, यह शोधपत्र LLM में फ़िंगरप्रिंटिंग के लिए एक व्यावहारिक समाधान प्रदान करता है, वर्तमान फ़िंगरप्रिंटिंग तकनीकों की कमज़ोरियों को उजागर करता है, और अधिक मज़बूत मॉडल सुरक्षा विधियों के विकास के लिए व्यापक मूल्यांकन मानदंड प्रस्तुत करता है।

Takeaways, Limitations

Takeaways:
प्रस्तुत है MEraser, जो बैकडोर-आधारित फिंगरप्रिंट्स को हटाने की एक प्रभावी विधि है।
कम मात्रा में डेटा के साथ भी उच्च-प्रदर्शन फिंगरप्रिंट हटाने की क्षमता प्राप्त करना
एक फिंगरप्रिंट हटाने की प्रणाली का विकास जिसे मॉडलों के बीच स्थानांतरित किया जा सके।
मौजूदा फिंगरप्रिंट प्रौद्योगिकी में कमजोरियों को उजागर करना और भविष्य के अनुसंधान की दिशाएं सुझाना।
एलएलएम बौद्धिक संपदा संरक्षण के लिए एक नया दृष्टिकोण प्रस्तुत करता है
Limitations:
यह निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है कि क्या एमईरेज़र की प्रभावशीलता को सभी प्रकार के बैकडोर-आधारित फिंगरप्रिंटिंग पर समान रूप से लागू किया जा सकता है।
अधिक परिष्कृत और शक्तिशाली फिंगरप्रिंट प्रौद्योगिकियों के लिए एमईरेजर की प्रभावशीलता को सत्यापित करने की आवश्यकता है।
वास्तविक दुनिया के LLM परिनियोजन वातावरण में MEraser की प्रयोज्यता और स्थिरता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
👍