Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Alineación directa de la trayectoria de difusión completa con la preferencia humana de grano fino

Created by
  • Haebom

Autor

Xiangwei Shen, Zhimin Li, Zhantao Yang, Shiyi Zhang, Yingfang Zhang, Donghao Li, Chunyu Wang, Qinglin Lu, Yansong Tang

Describir

Este artículo propone un método novedoso, Direct-Align, para abordar dos desafíos clave: el coste computacional de los métodos existentes que alinean directamente los modelos de difusión con las preferencias humanas y la necesidad de una adaptación continua del modelo de compensación offline. Direct-Align reduce el coste computacional del proceso de eliminación de ruido en varios pasos al definir un diccionario de ruido y recuperar eficazmente la imagen original en todos los pasos de tiempo mediante interpolación. Además, introduce la Optimización Semántica de Preferencias Relativa (SRPO), que utiliza señales condicionales de texto como compensación. Esto reduce la dependencia del ajuste fino de la compensación offline, ajustando la compensación online en función del refuerzo de las indicaciones, tanto positivas como negativas. En consecuencia, el ajuste fino del modelo FLUX triplica con creces el realismo y la calidad estética de los criterios de evaluación humana.

Takeaways, Limitations

Takeaways:
Se presenta un nuevo método (Direct-Align) para resolver eficazmente el problema de costo computacional del proceso de eliminación de ruido de múltiples pasos.
Presentamos un método de ajuste de compensación en línea (SRPO) que reduce la dependencia del ajuste fino de los modelos de compensación fuera de línea.
Mejora significativamente el realismo y la calidad estética del modelo FLUX.
Limitations:
Se necesita más investigación sobre el rendimiento de generalización del método propuesto.
Dado que los resultados son para un modelo específico (FLUX), se requiere verificar su aplicabilidad a otros modelos de difusión.
La alta dependencia de SRPO de las señales condicionales de texto puede afectar su rendimiento dependiendo de la calidad de la descripción del texto.
👍