Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

PuriDefense : purification antagoniste implicite locale aléatoire pour la défense contre les attaques basées sur des requêtes de type boîte noire

Created by
  • Haebom

Auteur

Ping Guo, Xiang Li, Zhiyuan Yang, Xi Lin, Qingchuan Zhao, Qingfu Zhang

Contour

Dans cet article, nous proposons PuriDefense, un mécanisme de défense efficace pour contrer la menace des attaques par requêtes de type boîte noire sur les systèmes d'apprentissage automatique en tant que service (MLaaS). PuriDefense effectue un raffinement aléatoire par patch à l'aide d'un ensemble de modèles de raffinement léger et reconstruit la variété d'images naturelles en exploitant des fonctions implicites locales à faible coût d'inférence. L'analyse théorique montre que la méthode proposée introduit un caractère aléatoire dans le raffinement, ce qui ralentit la vitesse de convergence des attaques par requêtes. Des expériences approfondies sur CIFAR-10 et ImageNet vérifient l'efficacité du mécanisme de défense proposé, basé sur le raffinement, et montrent une amélioration significative de la robustesse face aux attaques par requêtes. Ce mécanisme résout le problème suivant : les mécanismes de défense existants, tels que l'apprentissage antagoniste, le masquage de gradient et la transformation d'entrée, entraînent des coûts de calcul importants ou dégradent la précision des tests sur des entrées non antagonistes.

Takeaways, Limitations

Takeaways:
Nous présentons un mécanisme de défense efficace contre les attaques de requêtes basées sur la boîte noire avec un faible coût d'inférence.
Nous démontrons l’efficacité du raffinement aléatoire des unités de correctifs pour ralentir la vitesse de convergence des attaques basées sur des requêtes.
Nous vérifions empiriquement l’efficacité de la méthode proposée à travers des expériences CIFAR-10 et ImageNet.
Limitations:
Des recherches supplémentaires sont nécessaires pour déterminer les performances de généralisation du mécanisme de défense proposé.
Il est nécessaire d’évaluer davantage la robustesse de PuriDefense contre différents types d’attaques basées sur des requêtes.
Des recherches et des optimisations supplémentaires peuvent être nécessaires pour une application aux environnements MLaaS réels.
👍