[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

FlowAlign: Edición de imágenes basada en flujo sin inversión y con trayectoria regularizada

Created by
  • Haebom

Autor

Jeongsol Kim, Yeobin Hong, Jonghyun Park, Jong Chul Ye

Describir

Este artículo propone resolver el problema _____T7929__ de los métodos recientes de edición de imágenes basados en flujo no invertible, como FlowEdit, que permite la edición de imágenes basada en texto mediante la resolución de ecuaciones diferenciales ordinarias (EDO) utilizando modelos de flujo de imagen de ruido preentrenados, como Stable Diffusion 3. La ausencia de transformación invertible, una ventaja de FlowEdit, genera rutas de edición inestables y baja consistencia de la fuente. En este artículo, proponemos FlowAlign, un novedoso marco basado en flujo no invertible que resuelve estos problemas mediante un control óptimo de la ruta. FlowAlign introduce la similitud de la fuente en los puntos finales como un término de regularización para generar rutas más suaves y consistentes durante el proceso de edición. Se demuestra que esta regularización de puntos finales equilibra explícitamente la alineación semántica con la solicitud de edición y la consistencia estructural con la imagen de origen a lo largo de la ruta. Además, admitimos la edición invertible de forma natural simplemente invirtiendo la ruta de la EDO, lo que enfatiza la naturaleza reversible y consistente de la transformación. A través de experimentos exhaustivos, demostramos que FlowAlign supera a los métodos existentes en términos de preservación de fuentes y capacidad de control de edición.

Takeaways, Limitations

Takeaways:
Presentamos un nuevo marco que permite una edición de imágenes estable y consistente sin transformación inversa.
Solución de problemas de rutas de edición inestables mediante el uso de un control de ruta basado en control óptimo.
Considerando simultáneamente tanto la alineación semántica como la consistencia estructural a través de la regulación de puntos finales.
Soporte de edición inversa natural a través de inversión de ruta ODE.
Se mejoró la conservación de fuentes y el control de edición respecto a los métodos existentes.
Limitations:
Aunque no se menciona específicamente en el documento, los posibles problemas de Limitations pueden incluir mayores costos computacionales que pueden surgir durante la implementación y aplicación reales, o una disminución en el rendimiento de generalización para ciertos tipos de edición de imágenes.
👍