Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Amélioration de la robustesse de la détection d'objets : détection et restauration de la confiance en présence d'attaques de correctifs adverses

Created by
  • Haebom

Auteur

Roie Kazoom, Raz Birman, Ofer Hadar

Contour

Dans cet article, nous évaluons les mécanismes de défense contre les attaques par correctifs adverses sur le modèle de détection d'objets YOLOv5. Nous utilisons EigenCAM et la recherche par grille pour déterminer les emplacements optimaux des correctifs et plaçons les correctifs adverses optimisés générés dans des zones sensibles afin d'induire une dégradation des performances du modèle YOLOv5. Nous avons testé plusieurs techniques de défense, dont SAC, Inpainting et le modèle de diffusion latente, et constaté que les correctifs adverses diminuaient la fiabilité moyenne de détection de 22,06 %. Parmi les techniques de défense, SAC et Inpainting ont récupéré la fiabilité de respectivement 3,45 % et 5,05 %, et le modèle de diffusion latente a obtenu une amélioration de fiabilité de 26,61 %, ce qui surpasse la précision initiale. Cela suggère que le modèle de diffusion latente est très efficace pour atténuer les attaques par correctifs adverses.

Takeaways, Limitations

Takeaways:
Nous démontrons que le modèle de diffusion latente est très efficace pour se défendre contre les attaques de correctifs adverses sur YOLOv5.
Contribue à établir des stratégies de défense efficaces contre les attaques adverses en comparant les performances de diverses techniques de défense.
Une méthode optimale de placement de patchs adverses utilisant EigenCAM et la recherche de grille.
Limitations:
Résultats limités à un modèle spécifique de détection d'objets (YOLOv5) et aux attaques de correctifs adverses. La généralisation à d'autres modèles ou méthodes d'attaque est limitée.
Des recherches supplémentaires sont nécessaires sur l’applicabilité et les performances dans des environnements réels.
Il convient de prendre en compte le coût de calcul et la consommation de temps du modèle de diffusion latente.
👍