Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Alignement de sécurité personnalisé pour les modèles de diffusion texte-image

Created by
  • Haebom

Auteur

Yu Lei, Jinbin Bai, Qingyu Shi, Aosong Feng, Kaidong Yu

Contour

Cet article souligne les limites du mécanisme de sécurité des modèles de diffusion texte-image, qui ne prennent pas en compte les préférences individuelles des utilisateurs, et propose un cadre d'alignement de sécurité personnalisé (PSA). Le PSA intègre les profils utilisateurs au processus de diffusion afin d'adapter le comportement du modèle aux critères de sécurité individuels tout en préservant la qualité de l'image. Il intègre les préférences de sécurité spécifiques à chaque utilisateur grâce à un nouvel ensemble de données, Sage, et intègre les profils grâce à un mécanisme d'attention croisée. Les résultats expérimentaux démontrent que le PSA surpasse les méthodes existantes pour supprimer les contenus préjudiciables, génère un contenu mieux adapté aux contraintes des utilisateurs et atteint des taux de réussite et de réussite plus élevés. Le code, les données et les modèles sont accessibles au public.

Takeaways, Limitations

Takeaways:
Nous présentons un nouveau cadre pour améliorer la sécurité des modèles de génération de texte en image en appliquant des critères de sécurité personnalisables par l'utilisateur.
Offre la possibilité de paramètres de sécurité personnalisés qui prennent en compte divers facteurs tels que l'âge, la santé mentale et les croyances personnelles d'un individu.
Les résultats montrent de meilleures performances dans la suppression des contenus nuisibles et une plus grande satisfaction des contraintes des utilisateurs que les méthodes existantes.
Assurer la reproductibilité et l'évolutivité de la recherche grâce à du code, des données et des modèles ouverts.
Limitations:
Une validation supplémentaire de la taille et de la diversité de l’ensemble de données Sage est nécessaire.
Il est nécessaire de vérifier les performances de généralisation du cadre PSA et son applicabilité à divers modèles.
Il convient de prêter attention à l’exactitude et à la fiabilité des profils d’utilisateurs.
Des problèmes de sécurité doivent être pris en compte concernant la possibilité de manipulation de profil par des utilisateurs malveillants.
👍