दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

रेनबो नॉइज़: LGBTQ सामग्री पर तनाव-परीक्षण करने वाले बहुविध हानिकारक-मीम डिटेक्टर

Created by
  • Haebom

लेखक

रैन टोंग, सोंगताओ वेई, जियाकी लियू, लैनरुओ वांग

रूपरेखा

यह पत्र LGBTQ+ समुदाय को लक्षित करने वाले घृणास्पद मीम्स की समस्या को संबोधित करता है, जो कैप्शन या छवियों में मामूली बदलाव के साथ भी पहचान प्रणालियों से बच निकलते हैं। PrideMM डेटासेट का उपयोग करते हुए, हम चार यथार्थवादी कैप्शन हमलों और तीन सामान्य छवि भ्रष्टाचारों को मिलाकर पहला मजबूती बेंचमार्क बनाते हैं। दो अत्याधुनिक डिटेक्टरों, MemeCLIP और MemeBLIP2 का उपयोग केस स्टडी के रूप में करते हुए, हम एक हल्का टेक्स्ट डेनॉइजिंग एडेप्टर (TDA) प्रस्तुत करते हैं जो MemeBLIP2 के लचीलेपन को बेहतर बनाता है। प्रायोगिक परिणाम दर्शाते हैं कि MemeCLIP अधिक धीरे से ख़राब होता है, जबकि MemeBLIP2 विशेष रूप से कैप्शन संपादन के प्रति संवेदनशील है जो भाषा प्रसंस्करण में हस्तक्षेप करता है। हालांकि, TDA को जोड़ने से न केवल इस कमजोरी का समाधान होता है, बल्कि MemeBLIP2 समग्र रूप से सबसे मजबूत मॉडल बन जाता है

Takeaways, Limitations

Takeaways:
हम LGBTQ+ समुदाय को लक्षित करने वाले घृणास्पद मीम्स का पता लगाने की चुनौतियों और उन्हें संबोधित करने के लिए मजबूत मॉडल विकसित करने की आवश्यकता पर प्रकाश डालते हैं।
हम भविष्य के मॉडल विकास की दिशा सुझाने के लिए मेमेक्लिप और मेमेब्लिप2 की शक्तियों और कमजोरियों की तुलना और विश्लेषण करते हैं।
हम दर्शाते हैं कि हल्के TDA मॉड्यूल का उपयोग करके मल्टीमॉडल सुरक्षा मॉडल की मजबूती में सुधार किया जा सकता है।
हम मल्टीमॉडल मॉडलों की मजबूती में आर्किटेक्चर चयन और प्रीट्रेनिंग डेटा के महत्व पर प्रकाश डालते हैं।
Limitations:
प्राइडएमएम डेटासेट पर निर्भरता को देखते हुए, अन्य डेटासेटों पर सामान्यीकरण निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
यह सभी प्रकार के हमलों के व्यापक मूल्यांकन के बजाय, किसी विशिष्ट प्रकार के हमले के मूल्यांकन तक सीमित हो सकता है।
टीडीए की प्रभावशीलता विशिष्ट मॉडलों और डेटासेट तक सीमित हो सकती है, तथा अन्य मॉडलों और डेटासेटों पर इसकी सामान्यता निर्धारित करने के लिए और अधिक शोध की आवश्यकता है।
👍