Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

VideoEraser : effacement de concepts dans les modèles de diffusion texte-vidéo

Created by
  • Haebom

Auteur

Naen Xu, Jinghuai Zhang, Changjiang Li, Zhi Chen, Chunyi Zhou, Qingming Li, Tianyu Du, Shouling Ji

Contour

Cet article propose VideoEraser, un nouveau framework ne nécessitant aucune formation, pour répondre aux préoccupations en matière de confidentialité, de droits d'auteur et de sécurité liées à l'exploitation des modèles de diffusion texte-vidéo (T2V). VideoEraser est conçu comme un module prêt à l'emploi s'intégrant aux modèles de diffusion T2V existants grâce à un processus en deux étapes : ajustement sélectif de l'intégration provoquée (SPEA) et guidage du bruit résilient aux conflits (ARNG). VideoEraser empêche efficacement la création de vidéos contenant des concepts indésirables tels que des objets, des styles artistiques, des célébrités et du contenu explicite. Les résultats expérimentaux montrent que VideoEraser surpasse les méthodes existantes en termes d'efficacité, d'intégrité, de fidélité, de robustesse et de performances de généralisation, atteignant une réduction moyenne de 46 % du contenu indésirable sur quatre tâches, atteignant ainsi des performances de pointe.

Takeaways, Limitations

Takeaways:
Une nouvelle méthode permettant de supprimer efficacement la génération de contenu négatif dans le modèle de diffusion T2V sans formation est présentée.
Il présente une efficacité, une intégrité, une fidélité, une robustesse et des performances de généralisation améliorées par rapport aux méthodes existantes.
Facile à intégrer dans les modèles existants grâce à la fonctionnalité plug-and-play.
Contribuer à résoudre les problèmes de confidentialité, de droits d’auteur et de sécurité.
Limitations:
Il s’agit d’une évaluation des performances du modèle de diffusion T2V spécifique présenté dans l’article, et des recherches supplémentaires sont nécessaires pour déterminer sa généralisabilité à d’autres modèles.
Les performances de VideoEraser doivent être vérifiées par rapport à de nouveaux types de contenu indésirable ou à des invites plus sophistiquées.
Une analyse du coût de calcul et de la dégradation des performances de VideoEraser est nécessaire.
👍