दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

प्रॉम्प्ट पाइरेट्स को एक मानचित्र की आवश्यकता है: बीज चुराने से प्रॉम्प्ट चुराने में मदद मिलती है

Created by
  • Haebom

लेखक

फेलिक्स मचल , अश्वथ शेट्टी, जोनास सैंडर, निल्स लूज़, सोरेन पिर्क, थॉमस आइज़नबर्थ

रूपरेखा

यह शोधपत्र टेक्स्ट-टू-इमेज जेनरेशन डिफ्यूज़न मॉडल में प्रॉम्प्ट स्पूफिंग हमलों का अध्ययन करता है। हम मौजूदा संख्यात्मक अनुकूलन-आधारित प्रॉम्प्ट रिकवरी विधियों (T7725) की कमज़ोरियों को उजागर करते हैं और इमेज जेनरेशन के दौरान उपयोग किए जाने वाले शुरुआती रैंडम नंबरों के महत्व पर ज़ोर देते हैं। PyTorch के CPU-आधारित रैंडम नंबर जेनरेशन में सीमित सीड वैल्यू (2 32 ) के कारण एक भेद्यता (CWE-339) का फायदा उठाकर, हम प्रयोगात्मक रूप से प्रदर्शित करते हैं कि CivitAI प्लेटफ़ॉर्म पर लगभग 95% इमेज के सीड वैल्यू को SeedSnitch नामक टूल का उपयोग करके 140 मिनट के भीतर रिकवर किया जा सकता है। रिकवर किए गए सीड का उपयोग करते हुए, हम PromptPirate का प्रस्ताव करते हैं, जो एक जेनेटिक एल्गोरिथम-आधारित प्रॉम्प्ट स्पूफिंग विधि है जो मौजूदा अत्याधुनिक विधियों (PromptStealer, P2HP, और CLIP-Interrogator) की तुलना में 8-11% अधिक LPIPS समानता प्राप्त करती है। अंत में, हम बीज और अनुकूलन-आधारित शीघ्र स्पूफिंग को बेअसर करने के लिए प्रभावी प्रतिवाद प्रस्तुत करते हैं और इन कमजोरियों को दूर करने के लिए प्रासंगिक डेवलपर्स के साथ हमारे सहयोगात्मक प्रयासों का खुलासा करते हैं।

Takeaways, Limitations

Takeaways:
प्रसार मॉडल-आधारित छवि निर्माण में त्वरित अपहरण की गंभीरता का प्रदर्शन।
PyTorch की यादृच्छिक संख्या निर्माण सीमाओं के कारण एक नई भेद्यता (CWE-339) की खोज की गई और उसका दोहन किया गया।
हम एक त्वरित अपहरण हमले की तकनीक (प्रॉम्प्टपाइरेट) प्रस्तुत करते हैं जो मौजूदा तरीकों की तुलना में प्रदर्शन में सुधार करती है।
त्वरित अपहरण हमलों के विरुद्ध प्रभावी प्रतिउपाय प्रस्तुत करना।
अनुसंधान परिणामों के आधार पर डेवलपर्स के साथ सहयोग के माध्यम से कमजोरियों को दूर करने का प्रयास।
Limitations:
सीडस्निच की प्रभावशीलता सिविटएआई प्लेटफॉर्म पर मौजूद डेटा तक सीमित हो सकती है।
प्रस्तावित प्रतिउपायों के व्यावहारिक अनुप्रयोग और प्रभावशीलता पर आगे अनुसंधान की आवश्यकता है।
अन्य छवि निर्माण प्लेटफार्मों या यादृच्छिक संख्या निर्माण विधियों का भेद्यता विश्लेषण आवश्यक है।
👍