दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

वेरिटास: पैटर्न-अवेयर रीजनिंग के माध्यम से सामान्यीकृत डीपफेक का पता लगाना

Created by
  • Haebom

लेखक

हाओ टैन, जून लैन, जिचांग टैन, अजियान लियू, चुआनबियाओ सॉन्ग, सेनयुआन शि, हुइजिया झू, वेइकियांग वांग, जून वान, जेन लेई

रूपरेखा

यह शोधपत्र डीपफेक सामग्री की जटिल और विकासशील प्रकृति के कारण वास्तविक दुनिया के परिदृश्यों में इसकी चुनौतीपूर्ण प्रकृति पर प्रकाश डालता है। मौजूदा शैक्षणिक मानदंडों में आमतौर पर एकसमान प्रशिक्षण स्रोत और निम्न-गुणवत्ता वाली परीक्षण छवियाँ शामिल होती हैं, जो वर्तमान डिटेक्टरों के वास्तविक दुनिया में उपयोग को काफी हद तक हतोत्साहित करती हैं। इस कमी को पूरा करने के लिए, हम हाइड्राफेक डेटासेट प्रस्तुत करते हैं, जो पदानुक्रमित सामान्यीकरण परीक्षण के माध्यम से वास्तविक दुनिया की चुनौतियों का अनुकरण करता है। हाइड्राफेक में विभिन्न डीपफेक तकनीकें, फील्ड जालसाजी, कठोर प्रशिक्षण और मूल्यांकन प्रोटोकॉल शामिल हैं, और यह अनदेखे मॉडल आर्किटेक्चर, नवीन जालसाजी तकनीकों और नवीन डेटा डोमेन को कवर करता है। इन संसाधनों के आधार पर, हम वेरिटास, एक मल्टीमॉडल लार्ज-स्केल लैंग्वेज मॉडल (एमएलएलएम)-आधारित डीपफेक डिटेक्टर, प्रस्तावित करते हैं। पारंपरिक विचार प्रक्रियाओं (सीओटी) के विपरीत, हम पैटर्न पहचान अनुमान प्रस्तुत करते हैं, जिसमें मानव फोरेंसिक प्रक्रियाओं की नकल करने के लिए "योजना" और "आत्म-चिंतन" जैसे प्रमुख अनुमान पैटर्न शामिल हैं। हम इन डीपफेक अनुमान क्षमताओं को मौजूदा एमएलएलएम में निर्बाध रूप से एकीकृत करने के लिए एक दो-चरणीय प्रशिक्षण पाइपलाइन का भी प्रस्ताव करते हैं। हाइड्राफ़ेक डेटासेट पर किए गए प्रयोगों से पता चलता है कि पिछले डिटेक्टर क्रॉस-मॉडल परिदृश्यों में उत्कृष्ट सामान्यीकरण प्रदर्शन प्रदर्शित करते हैं, लेकिन अदृश्य जालसाजी और डेटा डोमेन में कमज़ोर पड़ जाते हैं। वेरिटास विभिन्न OOD परिदृश्यों में महत्वपूर्ण प्रदर्शन सुधार प्राप्त करता है, जिससे पारदर्शी और सटीक पहचान परिणाम प्राप्त होते हैं।

Takeaways, Limitations

Takeaways:
हम हाइड्राफेक प्रस्तुत कर रहे हैं, जो एक नया डेटासेट है जो वास्तविक दुनिया में डीपफेक पहचान की चुनौतियों को दर्शाता है।
हम वेरिटास का प्रस्ताव करते हैं, जो एक मल्टीमॉडल लार्ज-स्केल लैंग्वेज मॉडल (एमएलएलएम) पर आधारित एक नवीन डीपफेक डिटेक्टर है।
पैटर्न पहचान अनुमान के माध्यम से मानव फोरेंसिक तर्क प्रक्रियाओं की नकल करके पता लगाने के प्रदर्शन में सुधार करें।
वेरिटास विभिन्न आउट-ऑफ-डिस्ट्रीब्यूशन (OOD) परिदृश्यों में मौजूदा डिटेक्टरों से बेहतर प्रदर्शन करता है।
पारदर्शी और विश्वसनीय पहचान परिणाम प्रदान करता है।
Limitations:
हाइड्राफेक डेटासेट सभी वास्तविक दुनिया के डीपफेक खतरों को पूरी तरह से प्रतिबिंबित नहीं कर सकता है।
वेरिटास का प्रदर्शन हाइड्राफ़ेक डेटासेट पर प्रशिक्षण और मूल्यांकन पर निर्भर हो सकता है। अन्य डेटासेट पर सामान्यीकरण प्रदर्शन निर्धारित करने के लिए और अधिक शोध की आवश्यकता है।
एम.एल.एल.एम.-आधारित दृष्टिकोण कम्प्यूटेशनल दृष्टि से महंगे हो सकते हैं।
चूंकि नई डीपफेक प्रौद्योगिकियां उभरती रहती हैं, इसलिए वेरिटास को निरंतर अपडेट और सुधार की आवश्यकता होती है।
👍