दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ओपनफ़ेक: बड़े पैमाने पर डीपफ़ेक का पता लगाने के लिए एक खुला डेटासेट और प्लेटफ़ॉर्म

Created by
  • Haebom

लेखक

विक्टर लिवरनोचे, अक्षता अरोडी, एंड्रिया मुसुलन, ज़ाचरी यांग, एडम साल्वेल, गेटन मार्सेउ कैरन, जीन-फ़्रांसोइस गॉडबाउट, रेइहाने रब्बानी

रूपरेखा

यह शोधपत्र इस समस्या पर विचार करता है कि डीपफेक, अत्याधुनिक कृत्रिम बुद्धिमत्ता तकनीकों का उपयोग करके उत्पन्न सिंथेटिक मीडिया, विशेष रूप से राजनीतिक रूप से संवेदनशील संदर्भों में, दुष्प्रचार के प्रसार को बढ़ावा देते हैं। मौजूदा डीपफेक पहचान डेटासेट, पुरानी निर्माण विधियों, अवास्तविक छवियों, या एक ही चेहरे की छवि पर निर्भरता जैसी सीमाओं के कारण सामान्य सिंथेटिक छवियों का पता लगाने में अप्रभावी हैं। यह अध्ययन डीपफेक द्वारा दुष्प्रचार फैलाने के विभिन्न तरीकों की पहचान करने के लिए सोशल मीडिया पोस्ट का विश्लेषण करता है। इसके अलावा, मानव धारणा अनुसंधान दर्शाता है कि हाल ही में विकसित स्वामित्व वाले मॉडल सिंथेटिक छवियां उत्पन्न करते हैं जिन्हें वास्तविक छवियों से अलग करना मुश्किल होता है। इसलिए, यह शोधपत्र एक व्यापक, राजनीतिक रूप से केंद्रित डेटासेट प्रस्तुत करता है जिसे विशेष रूप से अत्याधुनिक जनरेटिव मॉडलों के पहचान प्रदर्शन का आकलन करने के लिए डिज़ाइन किया गया है। इस डेटासेट में वर्णनात्मक कैप्शन वाली 30 लाख वास्तविक छवियां और विभिन्न स्वामित्व वाले और ओपन-सोर्स मॉडलों का उपयोग करके उत्पन्न 9,63,000 उच्च-गुणवत्ता वाली सिंथेटिक छवियां शामिल हैं। जनरेटिव तकनीकों की निरंतर विकसित होती प्रकृति को ध्यान में रखते हुए, हम एक अभिनव क्राउडसोर्सिंग एडवर्सरीअल प्लेटफ़ॉर्म प्रस्तुत करते हैं जो प्रतिभागियों को चुनौतीपूर्ण सिंथेटिक छवियां उत्पन्न करने और प्रस्तुत करने के लिए प्रोत्साहित करता है। यह सतत, समुदाय-संचालित पहल यह सुनिश्चित करती है कि डीपफेक का पता लगाने के तरीके मजबूत और अनुकूलनीय हों, तथा परिष्कृत गलत सूचना के खतरों से सार्वजनिक संवाद की सक्रिय रूप से रक्षा करें।

Takeaways, Limitations

Takeaways:
बड़े पैमाने पर, उच्च गुणवत्ता वाले, राजनीतिक रूप से केंद्रित डीपफेक डिटेक्शन डेटासेट प्रदान करना, जिसमें अत्याधुनिक जनरेटिव मॉडल शामिल हों।
डीपफेक निर्माण और पहचान प्रौद्योगिकियों को निरंतर उन्नत करने के लिए क्राउडसोर्सिंग प्रतिकूल मंच का निर्माण करना।
सोशल मीडिया पर डीपफेक के प्रसार का विश्लेषण करके यह समझना कि गलत सूचना कैसे फैलती है
मानव डीपफेक पहचान क्षमताओं की सीमाओं को प्रदर्शित करने वाले प्रायोगिक परिणाम प्रस्तुत किए गए हैं।
Limitations:
डेटासेट के राजनीतिक पूर्वाग्रह पर विचार किया जाना चाहिए।
क्राउडसोर्सिंग प्लेटफॉर्म में प्रतिभागियों का पूर्वाग्रह और शोषण की संभावना
नई डीपफेक पीढ़ी प्रौद्योगिकियों के उद्भव पर निरंतर अद्यतन की आवश्यकता।
विविध भाषाई और सांस्कृतिक संदर्भों में सीमित सामान्यीकरण
👍