Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Empoisonner une fois, contrôler n'importe où : portes dérobées visuelles en texte clair dans les agents mobiles basés sur VLM

Created by
  • Haebom

Auteur

Xuan Wang, Siyuan Liang, Zhe Liu, Yi Yu, Aishan Liu, Yuliang Lu, Xitong Gao, Ee-Chien Chang

Contour

Cet article présente VIBMA, une nouvelle technique d'attaque par porte dérobée pour agents mobiles basée sur des modèles de langage visuel (MLV). VIBMA insère une porte dérobée en manipulant uniquement les entrées visuelles sans modifier le texte saisi. L'ajout de motifs visuels spécifiques (déclencheurs) déclenche les actions malveillantes spécifiées par l'attaquant. Nous avons conçu trois variantes de déclencheurs : des correctifs statiques, des motifs de mouvement dynamiques et un contenu mixte à faible transparence, afin de simuler des scénarios d'attaque réalistes. Des expériences utilisant six applications Android et trois MLV compatibles avec les appareils mobiles ont démontré un taux de réussite élevé (jusqu'à 94,67 %) et un maintien du fonctionnement normal (jusqu'à 95,85 %). Cette étude est la première à révéler des vulnérabilités de sécurité et des attaques par porte dérobée dans les agents mobiles, soulignant la nécessité de défenses robustes pour les pipelines d'adaptation des agents mobiles.

Takeaways, Limitations_

Takeaways:
Nous présentons pour la première fois la possibilité d'attaques de porte dérobée sur des agents mobiles basées sur des modèles de langage visuel.
Une nouvelle technique est proposée pour effectuer des attaques de porte dérobée en utilisant uniquement une entrée visuelle sans modifier la saisie de texte.
Présente diverses variantes de déclencheurs qui imitent des scénarios d'attaque réalistes.
Validation de l'efficacité des techniques d'attaque avec des taux de réussite élevés et des taux de détection faibles.
Souligne la nécessité d’une recherche défensive pour renforcer la sécurité des agents mobiles.
Limitations:
Il n’existe actuellement aucune technique de défense proposée et des recherches supplémentaires sur les techniques de défense contre les attaques sont nécessaires.
Les types et le nombre d’applications Android et de VLM utilisés dans l’expérience peuvent être limités.
Des recherches supplémentaires sont nécessaires sur les taux de réussite des attaques et les taux de détection dans divers environnements et situations.
👍