दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

लाइव ऑप्टिकल हस्ताक्षरों के साथ भाषण वीडियो के मिथ्याकरण का मुकाबला (विस्तारित संस्करण)

Created by
  • Haebom

लेखक

हैडली श्वार्ट्ज़, ज़ियाओफ़ेंग यान, चार्ल्स जे. कार्वर, ज़िया झोउ

रूपरेखा

वेरिलाइट उच्च-परिभाषा ऑडियो-वीडियो में छेड़छाड़-रोधी एक कम-उपरिव्यय, गैर-आक्रामक प्रणाली है। पारंपरिक डिजिटल छेड़छाड़-रोधी विधियों के विपरीत, वेरिलाइट घटना के समय एक गतिशील भौतिक हस्ताक्षर उत्पन्न करता है और उसे सूक्ष्म रूप से समायोजित प्रकाश का उपयोग करके प्रत्येक वीडियो रिकॉर्डिंग में एम्बेड करता है। यह भौतिक हस्ताक्षर स्पूफिंग को रोकने के लिए वक्ता की पहचान और चेहरे की गतिविधियों सहित ऑडियो घटनाओं की अनूठी अर्थगत विशेषताओं को एनकोड करता है। हस्ताक्षर को किसी भी वीडियो से निकाला जा सकता है और उसकी अखंडता की पुष्टि के लिए चित्रित ऑडियो सामग्री से सत्यापित किया जा सकता है। वेरिलाइट के प्रमुख घटकों में शामिल हैं (1) लोकैलिटी-सेंसिटिव हैशिंग पर आधारित एक बहुत ही कॉम्पैक्ट (150-बिट) पोज़-इनवेरिएंट ऑडियो-वीडियो फ़ीचर जनरेशन फ्रेमवर्क, और (2) एक ऑप्टिकल मॉड्यूलेशन विधि जो वीडियो और लाइव वीडियो दोनों में अदृश्य रहते हुए 200 बिट प्रति सेकंड (बीपीएस) ऑडियो को वीडियो में एम्बेड करती है। व्यापक वीडियो डेटासेट पर प्रायोगिक परिणाम दर्शाते हैं कि वेरिलाइट 0.99 से अधिक AUC और छेड़छाड़-रोधी वीडियो पहचान के लिए 100% की ट्रू पॉजिटिव दर प्राप्त करता है। इसके अलावा, यह व्हाइट-बॉक्स प्रतिकूल हमलों के विरुद्ध अत्यधिक मज़बूत है, जो रिकॉर्डिंग स्थितियों, वीडियो पोस्ट-प्रोसेसिंग तकनीकों और फ़ीचर निष्कर्षण विधियों के आधार पर भिन्न होते हैं। वेरिलाइट का डेमो https://mobilex.cs.columbia.edu/verilight पर पाया जा सकता है ।

Takeaways, Limitations

Takeaways:
एक नवीन प्रणाली प्रस्तुत की गई है जो कम ओवरहेड, गैर-आक्रामक तरीके से उच्च गुणवत्ता वाले ऑडियो वीडियो के साथ छेड़छाड़ को प्रभावी ढंग से रोकती है।
भौतिक हस्ताक्षरों पर आधारित एक नवीन दृष्टिकोण जो मौजूदा डिजिटल विधियों की सीमाओं पर विजय प्राप्त करता है।
प्रयोगात्मक रूप से सत्यापित उच्च सटीकता (AUC ≥ 0.99, सच्ची सकारात्मक दर 100%) और मजबूत स्थिरता।
विभिन्न रिकॉर्डिंग स्थितियों और पोस्ट-प्रोसेसिंग प्रक्रियाओं के लिए उच्च मजबूती।
Limitations:
प्रणाली को लागू करने के लिए आवश्यक विशेष उपकरण और प्रौद्योगिकी की जटिलता और लागत।
भौतिक हस्ताक्षर सम्मिलन के दौरान वीडियो गुणवत्ता में गिरावट की संभावना (हालांकि दावा किया जाता है कि यह न्यूनतम है)।
ऐसी स्थितियों के लिए प्रतिउपायों का अभाव जहां भौतिक हस्ताक्षर सम्मिलन संभव नहीं है (उदाहरण के लिए, मौजूदा वीडियो पर अनुप्रयोग)।
ऑप्टिकल मॉड्यूलेशन प्रौद्योगिकी की व्यावहारिक प्रयोज्यता पर और अधिक शोध की आवश्यकता है।
👍