यह शोधपत्र डीपफेक सामग्री की जटिल और विकासशील प्रकृति के कारण वास्तविक दुनिया के परिदृश्यों में इसकी चुनौतीपूर्ण प्रकृति पर प्रकाश डालता है। मौजूदा शैक्षणिक मानदंडों में आमतौर पर एकसमान प्रशिक्षण स्रोत और निम्न-गुणवत्ता वाली परीक्षण छवियाँ शामिल होती हैं, जो वर्तमान डिटेक्टरों के वास्तविक दुनिया में उपयोग को काफी हद तक हतोत्साहित करती हैं। इस कमी को पूरा करने के लिए, हम हाइड्राफेक डेटासेट प्रस्तुत करते हैं, जो पदानुक्रमित सामान्यीकरण परीक्षण के माध्यम से वास्तविक दुनिया की चुनौतियों का अनुकरण करता है। हाइड्राफेक में विभिन्न डीपफेक तकनीकें, फील्ड जालसाजी, कठोर प्रशिक्षण और मूल्यांकन प्रोटोकॉल शामिल हैं, और यह अनदेखे मॉडल आर्किटेक्चर, नवीन जालसाजी तकनीकों और नवीन डेटा डोमेन को कवर करता है। इन संसाधनों के आधार पर, हम वेरिटास, एक मल्टीमॉडल लार्ज-स्केल लैंग्वेज मॉडल (एमएलएलएम)-आधारित डीपफेक डिटेक्टर, प्रस्तावित करते हैं। पारंपरिक विचार प्रक्रियाओं (सीओटी) के विपरीत, हम पैटर्न पहचान अनुमान प्रस्तुत करते हैं, जिसमें मानव फोरेंसिक प्रक्रियाओं की नकल करने के लिए "योजना" और "आत्म-चिंतन" जैसे प्रमुख अनुमान पैटर्न शामिल हैं। हम इन डीपफेक अनुमान क्षमताओं को मौजूदा एमएलएलएम में निर्बाध रूप से एकीकृत करने के लिए एक दो-चरणीय प्रशिक्षण पाइपलाइन का भी प्रस्ताव करते हैं। हाइड्राफ़ेक डेटासेट पर किए गए प्रयोगों से पता चलता है कि पिछले डिटेक्टर क्रॉस-मॉडल परिदृश्यों में उत्कृष्ट सामान्यीकरण प्रदर्शन प्रदर्शित करते हैं, लेकिन अदृश्य जालसाजी और डेटा डोमेन में कमज़ोर पड़ जाते हैं। वेरिटास विभिन्न OOD परिदृश्यों में महत्वपूर्ण प्रदर्शन सुधार प्राप्त करता है, जिससे पारदर्शी और सटीक पहचान परिणाम प्राप्त होते हैं।