Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

EnvInjection : attaque par injection d'invite environnementale sur des agents Web multimodaux

Created by
  • Haebom

Auteur

Xilong Wang, John Bloch, Zedian Shao, Yuepeng Hu, Shuyan Zhou, Neil Zhenqiang Gong

Contour

Cet article propose une attaque par injection d'invite d'environnement (EnvInjection) contre des agents web basés sur des modèles de langage multimodaux à grande échelle (MLLM) qui interagissent avec des environnements de pages web. Pour surmonter les limites des attaques existantes, notamment leur efficacité et leur furtivité, ainsi que leur impraticabilité en environnement réel, nous présentons une nouvelle technique d'attaque qui perturbe les valeurs de pixels brutes des pages web affichées afin d'inciter l'agent web à effectuer une action spécifique (action cible) sélectionnée par l'attaquant. Pour surmonter la difficulté de la correspondance non différentiable entre les valeurs de pixels brutes et les captures d'écran, nous entraînons un réseau neuronal qui approxime cette correspondance et applique une descente de gradient projetée pour résoudre le problème d'optimisation. Une évaluation approfondie sur divers ensembles de données de pages web démontre qu'EnvInjection surpasse les modèles de référence existants.

Takeaways, Limitations

Takeaways:
Une nouvelle technique permettant d’attaquer efficacement les vulnérabilités des agents Web basés sur MLLM est présentée.
Amélioration de l'efficacité et des problèmes de furtivité des attaques existantes Limitations.
Applicabilité accrue aux environnements du monde réel.
Preuve de l'efficacité des techniques d'approximation et d'optimisation cartographiques utilisant les réseaux de neurones.
Limitations:
Dépendances possibles sur des pages Web et des agents Web spécifiques.
La complexité du processus de formation et d’optimisation des réseaux neuronaux.
Des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité des taux de réussite et des effets des attaques.
Une validation supplémentaire de la stabilité et de la robustesse dans les environnements Web réels est nécessaire.
👍