दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

कॉपीराइटशील्ड: कॉपीराइट उल्लंघन हमलों के विरुद्ध प्रसार मॉडल सुरक्षा को बढ़ाना

Created by
  • Haebom

लेखक

ज़िक्सियांग गुओ, सियुआन लियांग, एशान लियू, दाचेंग ताओ

रूपरेखा

यह शोधपत्र कॉपीराइटशील्ड का प्रस्ताव करता है, जो प्रसार मॉडल पर कॉपीराइट उल्लंघन के हमलों के विरुद्ध एक सुरक्षा ढाँचा है। यह उन हमलों पर केंद्रित है जहाँ हमलावर जानबूझकर गैर-कॉपीराइट छवियों को प्रशिक्षण डेटा में इंजेक्ट करते हैं, जिससे विशिष्ट प्रॉम्प्ट के लिए कॉपीराइट-उल्लंघनकारी सामग्री का निर्माण होता है। कॉपीराइटशील्ड प्रसार मॉडल की स्मृति तंत्र का विश्लेषण करके यह प्रकट करता है कि यह हमला विशिष्ट स्थानिक स्थानों और प्रॉम्प्ट के लिए ओवरफिटिंग का फायदा उठाता है। इसके बाद यह स्थानिक मास्किंग और डेटा इम्पुटेशन का उपयोग करके विषाक्त नमूनों का पता लगाने की एक विधि प्रस्तावित करता है। इसके अलावा, यह कॉपीराइट उल्लंघन विशेषताओं पर निर्भरता को कम करता है और एक अनुकूली अनुकूलन रणनीति के माध्यम से उत्पादन प्रदर्शन को बनाए रखता है जो प्रशिक्षण हानि में गतिशील दंड शर्तों को शामिल करती है। प्रायोगिक परिणाम दर्शाते हैं कि कॉपीराइटशील्ड दो हमले परिदृश्यों में विषाक्त नमूनों का पता लगाने के प्रदर्शन में उल्लेखनीय रूप से सुधार करता है, जिससे औसत F1 स्कोर 0.665, प्रथम आक्रमण काल ​​(FAE) विलंब 115.2%, और कॉपीराइट उल्लंघन दर (CIR) में 56.7% की कमी प्राप्त होती है। यह सबसे अच्छा प्रदर्शन करने वाली मौजूदा रक्षा प्रणाली की तुलना में 25% सुधार दर्शाता है।

____T98090_____, ____T98091_____

Takeaways:
हम कॉपीराइटशील्ड प्रस्तुत करते हैं, जो प्रसार मॉडल का उपयोग करके कॉपीराइट उल्लंघन के हमलों के विरुद्ध एक प्रभावी रक्षा ढांचा है।
स्थानिक मास्किंग और डेटा एट्रिब्यूशन का उपयोग करके जहरीले नमूनों का पता लगाने की विधि की प्रभावशीलता का प्रदर्शन।
हम अनुकूली अनुकूलन रणनीतियों के माध्यम से कॉपीराइट उल्लंघन निर्भरता को कम करने और उत्पादन प्रदर्शन को बनाए रखने की संभावना प्रस्तुत करते हैं।
मौजूदा सर्वोत्तम प्रदर्शन रक्षा की तुलना में 25% बेहतर रक्षा प्रभाव की पुष्टि की गई।
Limitations:
प्रस्तावित बचाव के सामान्यीकरण प्रदर्शन पर आगे अनुसंधान की आवश्यकता है।
विभिन्न प्रकार के कॉपीराइट उल्लंघन हमलों के विरुद्ध सुदृढ़ता मूल्यांकन की आवश्यकता है।
वास्तविक वातावरण में लागू होने पर उत्पन्न होने वाली संभावित समस्याओं और समाधानों का पता लगाना आवश्यक है।
👍