Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

FIT-Print : Vers une vérification de la propriété du modèle résistante aux fausses déclarations via une empreinte digitale ciblée

Created by
  • Haebom

Auteur

Shuo Shao, Haozhe Zhu, Yiming Li, Hongwei Yao, Tianwei Zhang, Zhan Qin

Contour

Cet article identifie les vulnérabilités des techniques d'empreintes digitales de modèles visant à protéger les droits de propriété intellectuelle des modèles open source et propose une nouvelle approche pour y remédier. Nous démontrons que les techniques d'empreintes digitales existantes, en raison de leur méthode de comparaison non ciblée, sont vulnérables aux attaques par fausses déclarations, où les attaquants prétendent qu'un modèle est le leur. Par conséquent, nous proposons FIT-Print, un paradigme d'empreintes digitales ciblées, et développons deux techniques d'empreintes digitales de modèles en boîte noire, FIT-ModelDiff et FIT-LIME, qui exploitent la distance entre les sorties du modèle et l'importance des caractéristiques d'échantillons spécifiques. Les résultats expérimentaux démontrent que la méthode proposée est plus robuste et plus efficace contre les attaques par fausses déclarations que les méthodes existantes.

Takeaways, Limitations

Takeaways:
Révèle la vulnérabilité des techniques d’empreintes digitales de modèles existantes aux attaques par fausses déclarations.
Nous proposons un paradigme d'empreinte digitale ciblée (FIT-Print) et de nouvelles techniques d'empreinte digitale de modèle de boîte noire (FIT-ModelDiff, FIT-LIME).
Développement d'une technique d'empreinte digitale de modèle robuste et efficace contre les attaques par fausses déclarations.
Présentation d'une nouvelle approche de la protection de la propriété intellectuelle dans le modèle open source.
Limitations:
Les performances de la méthode proposée peuvent varier en fonction du modèle et de l’ensemble de données utilisés.
Des recherches supplémentaires sont nécessaires sur l’applicabilité et l’évolutivité dans des environnements réels.
Une évaluation plus approfondie de la résistance à divers types d’attaques est nécessaire.
👍