[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Attaques génératives tenant compte de la structure sémantique pour une transférabilité antagoniste améliorée

Created by
  • Haebom

Auteur

Jongoh Jeong, Hunmin Yang, Jaeseok Jeong, Kuk-Jin Yoon

Contour

Cet article traite des attaques antagonistes génératives qui entraînent un générateur de perturbations sur un modèle de substitution boîte blanche en vue de son application à un modèle Big Team boîte arrière. Contrairement aux attaques itératives classiques, les attaques antagonistes génératives offrent une excellente efficacité en termes de temps d'inférence, d'évolutivité et de transférabilité. Cependant, les études précédentes n'ont pas pleinement exploité les capacités d'expression des modèles génératifs pour préserver et exploiter l'information sémantique. Dans cet article, nous soulignons que, bien que les activations intermédiaires du générateur contiennent des caractéristiques sémantiques riches, telles que les limites des objets et les formes brutes, elles ne sont pas pleinement exploitées, ce qui limite l'alignement des perturbations avec les régions liées aux objets. Pour résoudre ce problème, cet article propose un cadre d'attaque sensible à la structure sémantique basé sur Mean Teacher. Mean Teacher agit comme une référence de caractéristiques temporellement lissée, ce qui améliore la cohérence sémantique entre les activations de la couche initiale du modèle étudiant et les activations sémantiquement riches du modèle Teacher grâce à la distillation de caractéristiques. Sur la base de résultats expérimentaux, nous ancrons la génération de perturbations aux premiers blocs intermédiaires sémantiquement importants du générateur, induisant ainsi des perturbations antagonistes progressives dans des régions qui améliorent significativement la transférabilité antagoniste. Grâce à des expériences approfondies sur divers modèles, domaines et tâches, nous démontrons des améliorations de performances constantes par rapport aux attaques génératives de pointe existantes, et les évaluons de manière exhaustive à l'aide de métriques existantes et du taux de correction accidentelle (ACR) récemment proposé.

Takeaways, Limitations

Takeaways:
Un nouveau cadre pour améliorer la transférabilité des attaques adverses génératives
Amélioration de l'alignement des perturbations avec les régions liées aux objets en exploitant les informations sémantiques
Vérification de l'efficacité d'un cadre d'attaque prenant en compte la structure sémantique basé sur Mean Teacher
Présentation d'une nouvelle mesure d'évaluation, l'ACR
Présentation de résultats expérimentaux approfondis pour une variété de modèles, de domaines et de tâches
Limitations:
Augmentation potentielle du coût de calcul due à l'utilisation de Mean Teacher
Des recherches supplémentaires sont nécessaires sur l’applicabilité générale de l’indice ACR
Dépendance possible à un modèle de production spécifique
Une vérification supplémentaire de la généralisabilité est nécessaire en raison des limites de l’environnement expérimental.
👍