Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

CannyEdit: Control selectivo de Canny y guía con dos indicaciones para editar imágenes sin necesidad de entrenamiento

Created by
  • Haebom

Autor

Weiyan Xie, Han Gao, Didan Deng, Kaican Li, April Hua Liu, Yongxiang Huang, Nevin L. Zhang

Describir

Este artículo presenta un nuevo marco de trabajo, CannyEdit, para superar las limitaciones de los métodos existentes de edición de regiones basados en modelos de texto a imagen (T2I), que no pueden lograr simultáneamente fidelidad de texto, consistencia contextual y edición natural. CannyEdit aborda este desafío mediante dos innovaciones clave: Control Selectivo de Canny y Guía de Doble Aviso. El Control Selectivo de Canny restringe la guía estructural de Canny ControlNet a las regiones de edición especificadas por el usuario, a la vez que preserva los detalles de la imagen original en las regiones no editadas, logrando una edición precisa basada en texto y consistencia contextual. La Guía de Doble Aviso combina avisos locales para la edición específica de objetos e avisos globales para mantener la consistencia general de la escena. En tareas de edición de imágenes del mundo real (agregar, reemplazar y eliminar), CannyEdit supera a los métodos existentes (p. ej., KV-Edit) en un 2,93% frente a un 10,49% al equilibrar la fidelidad de texto y la consistencia contextual. Los estudios de usuarios también muestran que CannyEdit supera a los métodos existentes en términos de edición natural.

Takeaways, Limitations

Takeaways:
Se presenta un nuevo marco para mejorar simultáneamente la fidelidad del texto, la consistencia contextual y la naturalidad de la edición de los métodos de edición de dominio basados en modelos T2I existentes.
Consiga un rendimiento superior en tareas de edición de imágenes del mundo real mediante técnicas innovadoras como el control selectivo Canny y la guía de doble indicación.
Las investigaciones de usuarios han demostrado que los resultados de edición de CannyEdit son más naturales que los de los métodos existentes.
Limitations:
El artículo carece de referencias específicas a Limitations o direcciones de investigación futuras.
Se necesita más investigación para evaluar el rendimiento de generalización del método propuesto y su aplicabilidad a diferentes tipos de imágenes.
👍