Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Brèche dans le bouclier : dévoiler les vulnérabilités des grands modèles linguistiques

Created by
  • Haebom

Auteur

Runpeng Dai, Run Yang, Fan Zhou, Hongtu Zhu

Contour

Cet article analyse la vulnérabilité des modèles de langage à grande échelle (LLM) et des modèles de langage vision (VLM) afin d'identifier la cause de leur forte sensibilité aux petits changements. Nous proposons une nouvelle mesure de stabilité, l'influence locale de premier ordre (FI), basée sur la géométrie de l'information pour quantifier la sensibilité des paramètres individuels et des dimensions d'entrée (intégrations de pixels ou de jetons). En analysant divers LLM et VLM avec des paramètres allant de 1,5 milliard à 13 milliards, nous révélons qu'un petit nombre de paramètres ou de dimensions d'entrée avec des valeurs FI élevées contribuent de manière disproportionnée à la vulnérabilité des modèles, et montrons que l'atténuation de l'influence de ces paramètres vulnérables contribue à améliorer les performances du modèle.

Takeaways, Limitations

Takeaways:
Nous proposons une nouvelle approche pour l'analyse de la vulnérabilité des modèles en introduisant un nouvel indice de mesure de stabilité, FI, basé sur la géométrie de l'information.
En identifiant les paramètres et les dimensions d'entrée qui contribuent à la vulnérabilité du modèle, nous proposons des stratégies ciblées pour améliorer la robustesse du modèle.
Nous démontrons expérimentalement que l’atténuation de l’influence des paramètres vulnérables conduit à une amélioration des performances du modèle.
Limitations:
Des recherches supplémentaires sont nécessaires sur la généralité des mesures FI et leur applicabilité à diverses architectures de modèles.
Des recherches supplémentaires et des méthodologies plus efficaces sont nécessaires pour atténuer les effets des paramètres vulnérables.
L’échelle et les types de modèles utilisés dans l’analyse peuvent être limités, et l’analyse d’une plus grande variété de modèles est nécessaire.
👍