[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Generación de datos sintéticos mediante aumentos para mejorar el parecido facial en DreamBooth e InstantID

Created by
  • Haebom

Autor

Koray Ulusan, Benjamin Kiefer

Describir

Este artículo evalúa el impacto de las estrategias de aumento para mantener la similitud facial en la personalización de difusión estable para generar retratos de calidad profesional a partir de fotografías de aficionados. Para dos métodos de personalización, DreamBooth e InstantID, comparamos y analizamos el aumento convencional (volteo de izquierda a derecha, recorte y ajuste de color) con el aumento generativo utilizando imágenes sintéticas de InstantID. Evaluamos cuantitativamente la similitud facial utilizando SDXL y una novedosa métrica FaceDistance basada en FaceNet. Los resultados experimentales muestran que el aumento convencional puede producir artefactos que dificultan la identificación de personas, mientras que InstantID mejora la fidelidad cuando se usa de manera equilibrada con imágenes reales para evitar el sobreajuste. Un estudio de usuarios con 97 participantes confirma la diferencia entre la preferencia por la apariencia refinada de InstantID y la identificación precisa de personas de DreamBooth. Los resultados de este estudio proporcionan información sobre estrategias de aumento efectivas para la generación personalizada de texto a imagen.

Takeaways, Limitations

Takeaways:
Demostramos que una estrategia de aumento generativo que utiliza InstantID proporciona un mayor realismo fotográfico y preferencia del usuario en la generación de retratos personalizados que DreamBooth.
Contribuye a la mejora cualitativa de la creación de imágenes personalizadas al sugerir las deficiencias de las estrategias de aumento existentes y la utilización adecuada de estrategias de aumento generativo.
Presentamos un nuevo método para evaluar cuantitativamente la similitud de rostros a través de una nueva métrica FaceDistance.
Limitations:
El número de participantes en el estudio de usuarios puede ser limitado (97 participantes).
La dependencia de un modelo específico de reconocimiento facial (FaceNet) puede limitar la generalización de los resultados.
Se necesita más investigación sobre otros métodos de personalización más allá de InstantID y DreamBooth.
Se necesitan más investigaciones para determinar la generalización entre diferentes tipos de fotografía amateur.
👍