यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
लाइव ऑप्टिकल हस्ताक्षरों के साथ भाषण वीडियो के मिथ्याकरण का मुकाबला (विस्तारित संस्करण)
Created by
Haebom
लेखक
हैडली श्वार्ट्ज़, ज़ियाओफ़ेंग यान, चार्ल्स जे. कार्वर, ज़िया झोउ
रूपरेखा
वेरिलाइट उच्च-परिभाषा ऑडियो-वीडियो में छेड़छाड़-रोधी एक कम-उपरिव्यय, गैर-आक्रामक प्रणाली है। पारंपरिक डिजिटल छेड़छाड़-रोधी विधियों के विपरीत, वेरिलाइट घटना के समय एक गतिशील भौतिक हस्ताक्षर उत्पन्न करता है और उसे सूक्ष्म रूप से समायोजित प्रकाश का उपयोग करके प्रत्येक वीडियो रिकॉर्डिंग में एम्बेड करता है। यह भौतिक हस्ताक्षर स्पूफिंग को रोकने के लिए वक्ता की पहचान और चेहरे की गतिविधियों सहित ऑडियो घटनाओं की अनूठी अर्थगत विशेषताओं को एनकोड करता है। हस्ताक्षर को किसी भी वीडियो से निकाला जा सकता है और उसकी अखंडता की पुष्टि के लिए चित्रित ऑडियो सामग्री से सत्यापित किया जा सकता है। वेरिलाइट के प्रमुख घटकों में शामिल हैं (1) लोकैलिटी-सेंसिटिव हैशिंग पर आधारित एक बहुत ही कॉम्पैक्ट (150-बिट) पोज़-इनवेरिएंट ऑडियो-वीडियो फ़ीचर जनरेशन फ्रेमवर्क, और (2) एक ऑप्टिकल मॉड्यूलेशन विधि जो वीडियो और लाइव वीडियो दोनों में अदृश्य रहते हुए 200 बिट प्रति सेकंड (बीपीएस) ऑडियो को वीडियो में एम्बेड करती है। व्यापक वीडियो डेटासेट पर प्रायोगिक परिणाम दर्शाते हैं कि वेरिलाइट 0.99 से अधिक AUC और छेड़छाड़-रोधी वीडियो पहचान के लिए 100% की ट्रू पॉजिटिव दर प्राप्त करता है। इसके अलावा, यह व्हाइट-बॉक्स प्रतिकूल हमलों के विरुद्ध अत्यधिक मज़बूत है, जो रिकॉर्डिंग स्थितियों, वीडियो पोस्ट-प्रोसेसिंग तकनीकों और फ़ीचर निष्कर्षण विधियों के आधार पर भिन्न होते हैं। वेरिलाइट का डेमो https://mobilex.cs.columbia.edu/verilight पर पाया जा सकता है ।