Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

OpenFake: Un conjunto de datos abiertos y una plataforma para la detección de deepfakes a gran escala

Created by
  • Haebom

Autor

Victor Livernoche, Akshatha Arodi, Andreea Musulan, Zachary Yang, Adam Salvail, Gaetan Marceau Caron, Jean-Fran\c{c}ois Godbout, Reihaneh Rabbany

Describir

Este artículo aborda el problema de los deepfakes, medios sintéticos generados mediante técnicas de IA de vanguardia, que exacerban la propagación de la desinformación, especialmente en contextos políticamente sensibles. Los conjuntos de datos existentes para la detección de deepfakes son ineficaces para detectar imágenes sintéticas generales debido a limitaciones como métodos de generación obsoletos, imágenes irreales o la dependencia de una sola imagen facial. Este estudio analiza publicaciones en redes sociales para identificar las diversas formas en que los deepfakes propagan la desinformación. Además, la investigación sobre la percepción humana demuestra que los modelos propietarios desarrollados recientemente generan imágenes sintéticas difíciles de distinguir de las reales. Por lo tanto, este artículo presenta un conjunto de datos completo, con enfoque político, diseñado específicamente para evaluar el rendimiento de detección de los modelos generativos de vanguardia. Este conjunto de datos consta de 3 millones de imágenes reales con descripciones y 963.000 imágenes sintéticas de alta calidad generadas mediante diversos modelos propietarios y de código abierto. Reconociendo la constante evolución de las técnicas generativas, presentamos una innovadora plataforma de crowdsourcing antagónico que anima a los participantes a generar y enviar imágenes sintéticas complejas. Esta iniciativa continua, impulsada por la comunidad, garantiza que los métodos de detección de deepfakes sean sólidos y adaptables, protegiendo de forma proactiva el discurso público de amenazas de desinformación sofisticadas.

Takeaways, Limitations

Takeaways:
Proporcionar un conjunto de datos de detección de deepfakes a gran escala, de alta calidad y con enfoque político que incorpora modelos generativos de última generación.
Construcción de una plataforma de colaboración abierta contra adversarios para avanzar continuamente en las tecnologías de generación y detección de deepfakes.
Comprender cómo se propaga la desinformación mediante el análisis de la propagación de deepfakes en las redes sociales
Se presentan resultados experimentales que demuestran las limitaciones de la capacidad humana para detectar deepfakes.
Limitations:
Se debe tener en cuenta el sesgo político del conjunto de datos.
Sesgo de los participantes y potencial de explotación en las plataformas de crowdsourcing
La necesidad de actualizaciones constantes sobre el surgimiento de nuevas tecnologías de generación de deepfakes.
Generalización limitada en diversos contextos lingüísticos y culturales
👍