[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Injection rapide 2.0 : menaces d'IA hybrides

Created by
  • Haebom

Auteur

Jeremy McHugh, Kristina \v{S}ekrst, Jon Cefalu

Contour

Cet article présente une analyse complète de « Prompt Injection 2.0 », une évolution de l'attaque par injection rapide découverte par Preamble, Inc. en mai 2022 et signalée à OpenAI. Nous analysons notamment que l'émergence de systèmes d'IA de type agent exécutant de manière autonome des tâches en plusieurs étapes a conduit à l'évolution des attaques par injection rapide vers une menace hybride qui contourne systématiquement les contrôles de sécurité existants en les combinant à des vulnérabilités de cybersécurité existantes (par exemple, XSS, CSRF). Outre une évaluation des menaces modernes, notamment les vers IA, les infections multi-agents et les cyberattaques hybrides par IA, nous incluons des résultats de benchmark récents montrant que les pare-feu d'applications web, les filtres XSS, les jetons CSRF, etc. existants sont inefficaces face aux attaques améliorées par l'IA. Nous présentons également une solution architecturale combinant isolation des prompts, sécurité d'exécution, séparation des privilèges et capacités innovantes de détection des menaces.

Takeaways, Limitations

Takeaways:
Présente clairement la gravité de Prompt Injection 2.0 et les limites des systèmes de sécurité existants.
Identification d’un nouveau type de menace (attaques hybrides cyber-IA) résultant de l’émergence des systèmes d’agents IA.
Présenter empiriquement l’efficacité et les limites des technologies de sécurité existantes.
Proposer une solution d'architecture de défense efficace contre Prompt Injection 2.0.
Limitations:
Manque d’analyse détaillée de la mise en œuvre et des performances réelles de la solution architecturale proposée.
Des recherches supplémentaires sont nécessaires sur la généralisabilité à divers modèles d’IA et systèmes d’agents.
Des stratégies de surveillance et de réponse continues sont nécessaires pour les nouvelles variantes d’attaque par injection rapide.
👍