Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

MEraser : une approche efficace d'effacement des empreintes digitales pour les grands modèles linguistiques

Created by
  • Haebom

Auteur

Jingxuan Zhang, Zhenhua Xu, Rui Hu, Wenpeng Xing, Xuhong Zhang, Meng Han

Contour

Cet article présente Mismatched Eraser (MEraser), une technique d'empreinte digitale basée sur des portes dérobées, visant à répondre aux préoccupations relatives à la propriété et à la protection de la propriété intellectuelle dans les modèles de langage à grande échelle (LLM). MEraser supprime efficacement les empreintes digitales basées sur des portes dérobées tout en préservant les performances du modèle grâce à une stratégie de réglage fin en deux étapes utilisant des jeux de données non appariés et normaux. Grâce à des évaluations approfondies de diverses architectures LLM et méthodes d'empreinte digitale, nous démontrons que MEraser permet une empreinte digitale complète tout en préservant les performances du modèle, même avec un petit jeu de données d'apprentissage de moins de 1 000 échantillons. De plus, nous introduisons un mécanisme d'effacement transférable qui permet une empreinte digitale efficace sans apprentissage répétitif entre les modèles. En conclusion, cet article propose une solution pratique pour l'empreinte digitale dans les LLM, expose les vulnérabilités des techniques actuelles d'empreinte digitale et présente des critères d'évaluation complets pour le développement de méthodes de protection de modèle plus robustes.

Takeaways, Limitations

Takeaways:
Présentation de MEraser, une méthode efficace pour supprimer les empreintes digitales basées sur des portes dérobées.
Réaliser une suppression d'empreintes digitales haute performance même avec de petites quantités de données
Développement d'un mécanisme de suppression d'empreintes digitales transférable entre modèles.
Révéler les vulnérabilités de la technologie d’empreintes digitales existante et suggérer des orientations de recherche futures.
Le LLM propose une nouvelle approche de la protection de la propriété intellectuelle
Limitations:
Des recherches supplémentaires sont nécessaires pour déterminer si l’efficacité de MEraser peut être appliquée de manière égale à tous les types d’empreintes digitales basées sur des portes dérobées.
L’efficacité de MEraser doit être vérifiée pour des technologies d’empreintes digitales plus sophistiquées et plus puissantes.
Des recherches supplémentaires sont nécessaires pour déterminer l’applicabilité et la stabilité de MEraser dans des environnements de déploiement LLM réels.
👍