Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Alineación de seguridad personalizada para modelos de difusión de texto a imagen

Created by
  • Haebom

Autor

Yu Lei, Jinbin Bai, Qingyu Shi, Aosong Feng, Kaidong Yu

Describir

Este artículo señala las limitaciones del mecanismo de seguridad de los modelos de difusión texto-imagen, que no tienen en cuenta las preferencias individuales del usuario, y propone un marco de Alineación de Seguridad Personalizada (PSA). La PSA integra los perfiles de usuario en el proceso de difusión para adaptar el comportamiento del modelo a los criterios de seguridad individuales, manteniendo la calidad de la imagen. Incorpora las preferencias de seguridad específicas del usuario mediante un novedoso conjunto de datos, Sage, e integra los perfiles mediante un mecanismo de atención cruzada. Los resultados experimentales demuestran que la PSA supera a los métodos existentes en la supresión de contenido dañino, genera contenido que se ajusta mejor a las restricciones del usuario y logra mayores índices de éxito y de aprobación. El código, los datos y los modelos están disponibles públicamente.

Takeaways, Limitations

Takeaways:
Presentamos un nuevo marco para mejorar la seguridad de los modelos de generación de texto a imagen mediante la aplicación de criterios de seguridad personalizables por el usuario.
Ofrece la posibilidad de configuraciones de seguridad personalizadas que tienen en cuenta diversos factores como la edad del individuo, la salud mental y las creencias personales.
Los resultados muestran un mejor rendimiento en la supresión de contenido dañino y una mayor satisfacción de las restricciones del usuario que los métodos existentes.
Garantizar la reproducibilidad y escalabilidad de la investigación a través de código abierto, datos y modelos.
Limitations:
Se necesita una mayor validación del tamaño y la diversidad del conjunto de datos de Sage.
Es necesario verificar el rendimiento de generalización del marco PSA y su aplicabilidad a varios modelos.
Se debe tener en cuenta la precisión y fiabilidad de los perfiles de usuario.
Es necesario tener en cuenta las preocupaciones de seguridad respecto a la posibilidad de manipulación del perfil por parte de usuarios maliciosos.
👍