Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Combatiendo la falsificación de vídeos de voz con firmas ópticas en vivo (versión extendida)

Created by
  • Haebom

Autor

Hadleigh Schwartz, Xiaofeng Yan, Charles J. Carver, Xia Zhou

Describir

VeriLight es un sistema no invasivo y de bajo consumo para la protección contra manipulaciones de audio y vídeo de alta definición. A diferencia de los métodos convencionales de protección digital, VeriLight genera una firma física dinámica en el evento y la integra en cada grabación de vídeo mediante una luz finamente ajustada. Esta firma física codifica características semánticas únicas de los eventos de audio, como la identidad del hablante y los movimientos faciales, para evitar la suplantación de identidad. La firma puede extraerse de cualquier vídeo y verificarse con el contenido de audio representado para verificar su integridad. Los componentes clave de VeriLight incluyen (1) un marco de generación de características de audio y vídeo muy compacto (150 bits) e invariante a la pose, basado en hash sensible a la localidad, y (2) un método de modulación óptica que integra 200 bits por segundo (bps) de audio en el vídeo, permaneciendo imperceptible tanto en vídeo como en directo. Resultados experimentales con amplios conjuntos de datos de video demuestran que VeriLight alcanza un AUC ≥ 0,99 y una tasa de verdaderos positivos del 100 % para la detección de video a prueba de manipulaciones. Además, es altamente robusto contra ataques adversarios de caja blanca que varían según las condiciones de grabación, las técnicas de posprocesamiento de video y los métodos de extracción de características. Puede encontrar una demostración de VeriLight en https://mobilex.cs.columbia.edu/verilight .

Takeaways, Limitations

Takeaways:
Se presenta un sistema novedoso que evita eficazmente la manipulación de audio y vídeo de alta calidad de una manera no invasiva y con bajo consumo de recursos.
Un enfoque innovador basado en firmas físicas que supera las limitaciones de los métodos digitales existentes.
Alta precisión verificada experimentalmente (AUC ≥ 0,99, tasa de positivos verdaderos 100%) y fuerte estabilidad.
Alta robustez a diversas condiciones de grabación y procesos de postprocesamiento.
Limitations:
La complejidad y el costo del equipo y la tecnología especiales necesarios para implementar el sistema.
Posible degradación de la calidad del vídeo durante la inserción de la firma física (aunque se afirma que es mínima).
Falta de contramedidas para situaciones en las que no es posible la inserción de la firma física (por ejemplo, aplicación a vídeos existentes).
Se necesita más investigación sobre la aplicabilidad práctica de la tecnología de modulación óptica.
👍