Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
RevPRAG : Révélation des attaques par empoisonnement dans la génération augmentée par récupération grâce à l'analyse d'activation LLM
Created by
Haebom
Auteur
Xue Tan, Hao Luan, Mingyu Luo, Xiaoyan Sun, Ping Chen, Jun Dai
Contour
Cet article propose RevPRAG, une nouvelle technique de détection des attaques par empoisonnement RAG, une vulnérabilité des systèmes de génération augmentée de récupération (RAG). L'empoisonnement RAG consiste à injecter du texte malveillant dans une base de données de connaissances afin de générer la réponse souhaitée. RevPRAG est un pipeline de détection automatisé qui analyse les schémas d'activation des LLM afin de distinguer les réponses normales des réponses malveillantes. Il a obtenu un taux de vrais positifs de 98 % et un taux de faux positifs proche de 1 % sur divers jeux de données de référence et architectures RAG. Cela peut contribuer à renforcer la sécurité des systèmes RAG utilisant des bases de connaissances accessibles au public.
Takeaways, Limitations
•
Takeaways:
◦
Une technique efficace de détection d'empoisonnement au RAG présentée par l'analyse des modèles d'activation des LLM.
◦
Démontre une applicabilité pratique en obtenant un taux élevé de vrais positifs et un faible taux de faux positifs.
◦
Contribue à améliorer la sécurité du système RAG
•
Limitations:
◦
ÉTant donné qu’il s’agit de résultats d’évaluation des performances pour des LLM et des ensembles de données spécifiques, la généralisabilité à d’autres LLM et ensembles de données doit être vérifiée.
◦
La vérification des performances de détection pour les nouveaux types d’attaques par empoisonnement RAG est requise.
◦
Des recherches supplémentaires sont nécessaires sur l’efficacité et l’évolutivité dans des environnements réels.