Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Los piratas necesitan un mapa: robar semillas ayuda a robar indicaciones

Created by
  • Haebom

Autor

Felix Machtle, Ashwath Shetty, Jonas Sander, Nils Loose, Søren Pirk, Thomas Eisenbarth

Describir

Este artículo estudia los ataques de suplantación de indicaciones en modelos de difusión de generación de texto a imagen. Destacamos las debilidades de los métodos existentes de recuperación de indicaciones basados ​​en optimización numérica y enfatizamos la importancia de los números aleatorios iniciales utilizados durante la generación de imágenes. Al explotar una vulnerabilidad (CWE-339) debido a valores de semilla limitados (2 32 ) en la generación de números aleatorios basada en CPU de PyTorch, demostramos experimentalmente que los valores de semilla para aproximadamente el 95% de las imágenes en la plataforma CivitAI pueden recuperarse en 140 minutos utilizando una herramienta llamada SeedSnitch. Con las semillas recuperadas, proponemos PromptPirate, un método de suplantación de indicaciones basado en algoritmos genéticos que logra una similitud LPIPS entre un 8% y un 11% mayor que los métodos de vanguardia existentes (PromptStealer, P2HP y CLIP-Interrogator). Por último, presentamos contramedidas efectivas para neutralizar la suplantación de indicaciones basadas en semillas y optimización y revelamos nuestros esfuerzos de colaboración con desarrolladores relevantes para abordar estas vulnerabilidades.

Takeaways, Limitations

Takeaways:
Demostración de la gravedad del secuestro rápido en la generación de imágenes basada en modelos de difusión.
Se descubrió y explotó una nueva vulnerabilidad (CWE-339) debido a las limitaciones de generación de números aleatorios de PyTorch.
Presentamos una técnica de ataque de secuestro rápido (PromptPirate) que mejora el rendimiento con respecto a los métodos existentes.
Presentando contramedidas efectivas contra ataques de secuestro rápido.
Esfuerzos para resolver vulnerabilidades a través de la colaboración con los desarrolladores basados ​​en los resultados de la investigación.
Limitations:
La eficacia de SeedSnitch puede estar limitada a los datos de la plataforma CivitAI.
Se necesitan más investigaciones sobre la aplicación práctica y la eficacia de las contramedidas propuestas.
Se requiere análisis de vulnerabilidad de otras plataformas de generación de imágenes o métodos de generación de números aleatorios.
👍