Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

¡Mucha moda! Multicondicionamiento para la generación de imágenes mediante la combinación de boceto y texto

Created by
  • Haebom

Autor

Federico Girella, Davide Talon, Ziyue Liu, Zanxi Ruan, Yiming Wang, Marco Cristani

Describir

Este artículo presenta LOTS (Texto y Boceto LOcalizados para la generación de imágenes de moda), un método que combina bocetos e información textual, considerando el complejo proceso creativo del diseño de moda. LOTS combina descripciones globales con información local de bocetos y texto para generar imágenes de moda completas mediante una estrategia de fusión gradual basada en un modelo de difusión. Mediante una representación modular centrada en pares, el boceto y el texto se codifican en un espacio latente compartido, manteniendo características locales independientes. La guía basada en la atención integra las condiciones locales y globales durante el proceso de eliminación de ruido en varios pasos del modelo de difusión. Presentamos un nuevo conjunto de datos de moda, Sketchy, y demostramos su rendimiento superior en comparación con los métodos existentes mediante evaluaciones cuantitativas y cualitativas.

Takeaways, Limitations

Takeaways:
Combine eficazmente la información del boceto y el texto para mejorar la precisión y el detalle de la creación de imágenes de moda.
Presentamos una nueva forma de controlar los detalles de un diseño aprovechando la información local.
Estamos lanzando un nuevo conjunto de datos de moda, Sketchy, para contribuir a futuras investigaciones.
Puede contribuir al avance del diseño de moda logrando un rendimiento superior en comparación con los métodos existentes.
Limitations:
El tamaño y la diversidad del conjunto de datos Sketchy podrían mejorarse en el futuro.
Puede que no refleje perfectamente todos los aspectos del diseño de moda complejo.
Es necesario definir claramente las diferencias entre el proceso de diseño de moda del mundo real y el proceso de diseño de moda del mundo real.
👍