Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

VideoEraser: Borrado de conceptos en modelos de difusión de texto a vídeo

Created by
  • Haebom

Autor

Naen Xu, Jinghuai Zhang, Changjiang Li, Zhi Chen, Chunyi Zhou, Qingming Li, Tianyu Du, Shouling Ji

Describir

Este artículo propone VideoEraser, un novedoso framework que no requiere entrenamiento, para abordar las preocupaciones sobre privacidad, derechos de autor y seguridad derivadas de la explotación de modelos de difusión de texto a vídeo (T2V). VideoEraser está diseñado como un módulo listo para usar que puede integrarse en los modelos de difusión T2V existentes mediante un proceso de dos pasos: Ajuste Selectivo de Incrustaciones Incitadas (SPEA) y Guía de Ruido Resistente a Adversarios (ARNG). VideoEraser previene eficazmente la creación de vídeos que contengan conceptos no deseados, como objetos, estilos artísticos, celebridades y contenido explícito. Los resultados experimentales muestran que VideoEraser supera a los métodos existentes en eficiencia, integridad, fidelidad, robustez y rendimiento de generalización, logrando una reducción promedio del 46 % de contenido no deseado en cuatro tareas, alcanzando un rendimiento de vanguardia.

Takeaways, Limitations

Takeaways:
Se presenta un nuevo método para suprimir eficazmente la generación de contenido negativo en el modelo de difusión T2V sin entrenamiento.
Muestra una mejora en la eficiencia, integridad, fidelidad, robustez y rendimiento de generalización en comparación con los métodos existentes.
Fácil de integrar en modelos existentes con funcionalidad plug-and-play.
Contribuir a resolver problemas de privacidad, derechos de autor y seguridad.
Limitations:
Esta es una evaluación del desempeño del modelo de difusión T2V específico presentado en el artículo, y se necesita más investigación para determinar su generalización a otros modelos.
Es necesario verificar el rendimiento de VideoEraser frente a nuevos tipos de contenido no deseado o indicaciones más sofisticadas.
Es necesario analizar el coste computacional y la degradación del rendimiento de VideoEraser.
👍