Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

DATABench : Évaluation de l'audit des ensembles de données dans l'apprentissage profond d'un point de vue contradictoire

Created by
  • Haebom

Auteur

Shuo Shao, Yiming Li, Mengren Zheng, Zhiyang Hu, Yukun Chen, Boheng Li, Yu He, Junfeng Guo, Dacheng Tao, Zhan Qin

Contour

Cet article étudie les techniques d'audit d'ensembles de données afin de résoudre les problèmes de confidentialité et de droits d'auteur découlant du manque de transparence des ensembles de données utilisés pour l'entraînement des modèles d'apprentissage profond. Nous analysons les vulnérabilités des techniques d'audit d'ensembles de données existantes aux attaques adverses et proposons un nouveau système de classification qui les catégorise en méthodes basées sur les caractéristiques internes (IF) et les caractéristiques externes (EF). De plus, nous définissons deux principaux types d'attaques : les attaques par évasion, qui dissimulent l'utilisation des ensembles de données, et les attaques par falsification, qui revendiquent faussement des ensembles de données inutilisés. Nous proposons des stratégies d'attaque systématiques pour chaque type (séparation, suppression et détection pour les attaques par évasion ; méthodes basées sur des exemples adverses pour les attaques par falsification). Enfin, nous présentons un nouveau benchmark, DATABench, composé de 17 attaques par évasion, cinq attaques par falsification et neuf techniques d'audit représentatives. Les résultats de notre évaluation démontrent que les techniques d'audit existantes ne sont pas suffisamment robustes ni discriminantes dans les environnements adverses.

Takeaways, Limitations

Takeaways:
Nous analysons systématiquement la vulnérabilité des techniques d’audit des ensembles de données aux attaques adverses et fournissons une nouvelle référence, DATABench, suggérant des orientations de recherche futures.
Nous proposons un nouveau système de classification qui classe les techniques d’audit existantes en fonction des caractéristiques internes (IF) et des caractéristiques externes (EF).
Nous présentons une stratégie d’attaque systématique contre les attaques d’évasion et de falsification.
Limitations:
Bien qu’il démontre que les techniques actuelles d’audit des ensembles de données sont vulnérables aux attaques adverses, il n’offre pas de solutions spécifiques pour développer des techniques d’audit plus robustes et plus fiables.
Les types d'attaques et les techniques d'audit inclus dans DATABench peuvent être limités. Les futurs benchmarks devraient être étendus pour inclure un éventail plus large d'attaques et de techniques d'audit.
👍