Este artículo presenta un nuevo marco de trabajo, CannyEdit, para superar las limitaciones de los métodos existentes de edición de regiones basados en modelos de texto a imagen (T2I), que no pueden lograr simultáneamente fidelidad de texto, consistencia contextual y edición natural. CannyEdit aborda este desafío mediante dos innovaciones clave: Control Selectivo de Canny y Guía de Doble Aviso. El Control Selectivo de Canny restringe la guía estructural de Canny ControlNet a las regiones de edición especificadas por el usuario, a la vez que preserva los detalles de la imagen original en las regiones no editadas, logrando una edición precisa basada en texto y consistencia contextual. La Guía de Doble Aviso combina avisos locales para la edición específica de objetos e avisos globales para mantener la consistencia general de la escena. En tareas de edición de imágenes del mundo real (agregar, reemplazar y eliminar), CannyEdit supera a los métodos existentes (p. ej., KV-Edit) en un 2,93% frente a un 10,49% al equilibrar la fidelidad de texto y la consistencia contextual. Los estudios de usuarios también muestran que CannyEdit supera a los métodos existentes en términos de edición natural.