Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

AUDETER: Un conjunto de datos a gran escala para la detección de audio deepfake en mundos abiertos

Created by
  • Haebom

Autor

Qizhou Wang, Hanxun Huang, Guansong Pang, Sarah Erfani, Christopher Leckie

Describir

Este artículo presenta AUDETER, un conjunto de datos de audio deepfake a gran escala y diverso, para abordar los desafíos de la detección de audio deepfake. Los métodos existentes de detección de deepfake sufren una degradación del rendimiento en entornos reales debido a discrepancias entre los datos de entrenamiento y los datos reales. AUDETER aborda este desafío incorporando más de 3 millones de clips de audio (más de 4500 horas) generados por 11 modelos de texto a voz y 10 vocoders. Los resultados experimentales muestran que los métodos de vanguardia entrenados con conjuntos de datos existentes tienen dificultades para generalizarse a nuevas muestras de audio deepfake y presentan altas tasas de falsos positivos. Por el contrario, los métodos entrenados con AUDETER logran un buen rendimiento de detección y reducen significativamente las tasas de error.

Takeaways, Limitations

Takeaways:
Contribuimos al avance de la detección de audio deepfake al proporcionar AUDETER, un conjunto de datos de audio deepfake a gran escala y diverso.
A través de experimentos con AUDETER, demostramos claramente las limitaciones de los métodos de detección de deepfakes existentes y enfatizamos la necesidad de desarrollar un modelo de detección generalizado.
Demostramos que el entrenamiento basado en AUDETER puede mejorar significativamente el rendimiento de detección de deepfakes (logrando una tasa de error del 4,17%).
Limitations:
A pesar de la diversidad de AUDETER, es posible que no abarque por completo todos los tipos de audio deepfake del mundo real.
A medida que surgen nuevas tecnologías de generación de deepfakes, la validez de AUDETER puede disminuir con el tiempo.
Aunque el conjunto de datos es grande, existe la posibilidad de que ciertos tipos de audio deepfake estén subrepresentados o sobrerrepresentados.
👍