Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Vers la furtivité des portes dérobées dans l'espace des paramètres du modèle

Created by
  • Haebom

Auteur

Xiaoyun Xu, Zhuoran Liu, Stefanos Koffas, Stjepan Picek

Contour

Cet article souligne que les attaques par porte dérobée existantes se concentrent uniquement sur la dissimulation dans l'espace d'entrée ou l'espace des caractéristiques, ce qui les rend vulnérables à diverses techniques de défense. En analysant 12 attaques par porte dérobée courantes et 17 techniques de défense, nous constatons que même les attaques par porte dérobée dissimulées dans les espaces d'entrée et de caractéristiques sont vulnérables aux techniques de défense qui sondent l'espace des paramètres. En analysant la cause de cette vulnérabilité, nous découvrons la présence de neurones importants liés aux portes dérobées dans l'espace des paramètres et proposons Grond, une nouvelle technique d'attaque de la chaîne logistique qui prend en compte la dissimulation dans l'espace des paramètres. Grond améliore la dissimulation dans l'espace des paramètres en limitant les modifications de paramètres grâce au module Adversarial Backdoor Injection (ABI). Les résultats expérimentaux montrent que Grond surpasse 12 attaques par porte dérobée existantes contre les techniques de défense de pointe (y compris les défenses adaptatives) sur les sous-ensembles CIFAR-10, GTSRB et ImageNet. Nous démontrons également que l'ABI améliore systématiquement l'efficacité des attaques par porte dérobée courantes.

Takeaways, Limitations

Takeaways:
Nous révélons les limites des attaques de porte dérobée existantes qui se concentrent uniquement sur la dissimulation de l'espace d'entrée et des fonctionnalités.
Présentation d'une nouvelle possibilité de défense par porte dérobée grâce à l'analyse de l'espace paramétrique.
Proposition d'une nouvelle technique d'attaque par porte dérobée, Grond, considérant la nature cachée de l'espace des paramètres et la vérification de son efficacité.
Suggérant la possibilité d'améliorer l'efficacité des attaques de porte dérobée à l'aide du module ABI.
Limitations:
ÉTant donné que l’efficacité de Grond repose sur des résultats expérimentaux pour des ensembles de données et des techniques de défense spécifiques, des recherches supplémentaires sont nécessaires sur sa généralisabilité à d’autres environnements.
Une analyse plus approfondie de la complexité informatique et de l’applicabilité du module ABI est nécessaire.
La stabilité de Grond doit être vérifiée par rapport à des techniques de défense plus diverses et plus sophistiquées.
👍