Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Marco Wukong para la detección de situaciones no seguras para el trabajo en sistemas de texto a imagen

Created by
  • Haebom

Autor

Mingrui Liu, Sixiao Zhang, Cheng Long

Describir

Este artículo propone Wukong, un nuevo marco para la detección eficiente y precisa de contenido no seguro para los usuarios (NSFW) en modelos de conversión de texto a imagen (T2I). Los métodos actuales basados en filtros de texto analizan únicamente las indicaciones del usuario, ignorando las variaciones específicas del modelo y haciéndolos vulnerables a ataques adversarios. Los métodos basados en filtros de imagen presentan sobrecarga computacional y una larga latencia. Wukong es un marco basado en Transformer que aprovecha las salidas intermedias (eliminación temprana de ruido) de un modelo de difusión y reutiliza parámetros de atención cruzada preentrenados de U-Net. Esto permite la detección temprana de contenido NSFW dentro del proceso de difusión, eliminando la necesidad de esperar a que se complete el proceso de generación de imágenes. Además, presentamos un nuevo conjunto de datos que contiene indicaciones, semillas y etiquetas NSFW específicas de la imagen. Evaluamos Wukong con este conjunto de datos y dos puntos de referencia públicos, demostrando una eficiencia y precisión superiores en comparación con los métodos existentes.

Takeaways, Limitations

Takeaways:
Proponemos un nuevo método para detectar eficientemente contenido NSFW en la etapa intermedia del proceso de difusión del modelo T2I.
Se logró una mayor eficiencia y una precisión similar o mejor que los métodos existentes (filtro de texto, filtro de imagen).
Puede contribuir a futuras investigaciones proporcionando un nuevo conjunto de datos NSFW.
Limitations:
Faltan detalles específicos sobre el tamaño y la diversidad del conjunto de datos propuesto.
Se necesitan más investigaciones para determinar qué tan bien se generaliza el desempeño de Wukong en diferentes modelos T2I y diferentes tipos de contenido NSFW.
Hay una falta de apreciación por la resistencia de Wukong frente a ataques hostiles.
👍