Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

FairHuman: Mejora de la calidad de las manos y los rostros en la generación de imágenes humanas con un retraso potencial mínimo. Equidad en modelos de difusión.

Created by
  • Haebom

Autor

Yuxuan Wang, Tianwei Cao, Huayu Zhang, Zhongjiang He, Kongming Liang, Zhanyu Ma

Describir

Este artículo señala que, si bien la generación de imágenes ha avanzado significativamente con el desarrollo de modelos de texto a imagen a gran escala, especialmente los basados ​​en difusión, resulta difícil generar detalles realistas como rostros y manos. Para abordar este problema, proponemos FairHuman, un método de ajuste fino multiobjetivo diseñado para mejorar de forma justa la calidad de la generación global y local. FairHuman utiliza un objetivo global y dos objetivos locales para manos y rostros, y deriva una estrategia óptima de actualización de parámetros basada en el criterio de retardo potencial mínimo (MPD) para lograr una optimización justa en problemas multiobjetivo. Esto mejora significativamente la generación de detalles locales complejos, manteniendo la calidad general. Mediante experimentos exhaustivos, demostramos la eficacia de nuestro método para mejorar el rendimiento de la generación de imágenes humanas en diversos escenarios.

Takeaways, Limitations

Takeaways:
Demostramos que el ajuste fino de múltiples objetivos puede mejorar la capacidad de generación de detalles locales de los modelos de generación de texto a imagen.
Proponemos una estrategia de optimización justa utilizando el criterio MPD para resolver eficazmente problemas multiobjetivo.
Logra mantener la calidad general de la imagen al tiempo que mejora la calidad de generación de detalles locales difíciles, como rostros y manos.
Limitations:
El método propuesto requiere anotaciones previas para manos y rostros. El rendimiento puede verse afectado por la calidad y cantidad de los datos de anotación.
Se necesita más investigación sobre la escalabilidad a otros detalles regionales (por ejemplo, cabello, ropa).
Se necesita más verificación para determinar si la aplicación del criterio MPD puede generalizarse a otros tipos de problemas multiobjetivo.
👍