[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

DynamicID: personalización de imágenes multiidentificación de disparo cero con edición facial flexible

Created by
  • Haebom

Autor

Xirui Hu, Jiahao Wang, Hao Chen, Weizhan Zhang, Benqi Wang, Yikun Li, Haishun Nan

Describir

Este artículo se centra en la generación de imágenes humanas personalizadas que representan identidades específicas a partir de imágenes de referencia. Si bien los métodos existentes han logrado una preservación de identidad de alta fidelidad, se limitan a escenarios de identificación única y carecen de capacidades de edición facial. En este artículo, presentamos DynamicID, un marco de trabajo sin necesidad de ajustes que permite la generación de personalización de identificación única y múltiple con alta fidelidad y capacidades flexibles de edición facial. Entre las innovaciones clave se incluyen la Atención Activada Semántica (SAA), que minimiza la interferencia del modelo base al inyectar características de identificación y logra la personalización de múltiples identificaciones sin múltiples muestras de identificación durante el entrenamiento; el Reconfigurador de Identidad-Movimiento (IMR), que separa y reconfigura eficazmente el movimiento facial y las características de identificación para permitir la edición facial flexible; un paradigma de entrenamiento con separación de tareas que reduce la dependencia de los datos; y el conjunto de datos VariFace-10k, donde 10 000 individuos únicos están representados por 35 imágenes faciales diferentes cada uno. Los resultados experimentales muestran que DynamicID supera a los métodos de última generación en términos de fidelidad de identidad, capacidades de edición facial y capacidades de personalización de múltiples identificaciones.

Takeaways, Limitations

Takeaways:
Presentamos un nuevo marco (DynamicID) que proporciona generación de imágenes personalizadas de alta calidad con identificación única y múltiple sin necesidad de ajustes.
Lograr una alta capacidad de edición facial y preservación de la identidad con Atención Activada Semántica (SAA) y Reconfigurador de Identidad-Movimiento (IMR).
Reducir la dependencia de los datos y mejorar el rendimiento aprovechando el paradigma de entrenamiento separado por tareas y el conjunto de datos VariFace-10k.
Resuelve eficazmente los problemas de identificación única y baja editabilidad facial de los métodos existentes.
Limitations:
Se necesita una revisión más profunda con respecto al tamaño y la diversidad del conjunto de datos VariFace-10k.
Puede haber prejuicios contra ciertas razas o géneros.
Falta de discusión sobre consideraciones éticas y posibles vulnerabilidades en aplicaciones del mundo real.
👍