Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

RevPRAG: Revelando ataques de envenenamiento en la generación aumentada por recuperación mediante análisis de activación LLM

Created by
  • Haebom

Autor

Xue Tan, Hao Luan, Mingyu Luo, Xiaoyan Sun, Ping Chen, Jun Dai

Describir

Este artículo propone RevPRAG, una novedosa técnica de detección para ataques de envenenamiento de RAG, una vulnerabilidad en los sistemas de Generación Aumentada por Recuperación (RAG). El envenenamiento de RAG implica la inyección de texto malicioso en una base de datos de conocimiento para generar la respuesta deseada. RevPRAG es un canal de detección automatizado que analiza los patrones de activación de los LLM para distinguir entre respuestas normales y maliciosas. Se logró una tasa de verdaderos positivos del 98% y una tasa de falsos positivos cercana al 1% en diversos conjuntos de datos de referencia y arquitecturas RAG. Esto puede contribuir a fortalecer la seguridad de los sistemas RAG que utilizan bases de datos de conocimiento de acceso público.

Takeaways, Limitations

Takeaways:
Se presenta una técnica eficaz de detección de envenenamiento por RAG a través del análisis de los patrones de activación de los LLM.
Demuestra aplicabilidad práctica al lograr una alta tasa de verdaderos positivos y una baja tasa de falsos positivos.
Contribuye a mejorar la seguridad del sistema RAG
Limitations:
Dado que estos son resultados de evaluación de desempeño para LLM y conjuntos de datos específicos, es necesario verificar la generalización a otros LLM y conjuntos de datos.
Se requiere verificar el rendimiento de detección para nuevos tipos de ataques de envenenamiento de RAG.
Se necesita más investigación sobre la eficiencia y la escalabilidad en entornos del mundo real.
👍