[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Muestreo DDIM mejorado con mezclas gaussianas de coincidencia de momentos

Created by
  • Haebom

Autor

Prasad Gabbur

Describir

En este artículo, proponemos utilizar el Modelo de Mezcla Gaussiana (GMM) como un operador de retrotransición (kernel) en el marco del Modelo Implícito de Difusión de Denoising (DDIM), que es uno de los métodos ampliamente utilizados para el muestreo acelerado de modelos preentrenados en el Modelo Probabilístico de Difusión de Denoising (DDPM). Específicamente, restringimos los parámetros del GMM para que coincidan con los momentos centrales primero y segundo de las probabilidades marginales directas del DDPM. Los resultados experimentales muestran que la coincidencia de momentos es suficiente para obtener muestras con calidad equivalente o mejor que el DDIM convencional utilizando el kernel Gaussiano. Los resultados experimentales se presentan utilizando modelos incondicionales entrenados en CelebAHQ y FFHQ y modelos condicionales entrenados en el conjunto de datos ImageNet. Los resultados sugieren que el uso del kernel del GMM con un pequeño número de pasos de muestreo mejora significativamente la calidad de las muestras generadas, medida por las métricas FID e IS. Por ejemplo, al utilizar 10 pasos de muestreo en ImageNet 256x256, logramos FID 6,94 e IS 207,85 utilizando el kernel GMM, mientras que 10,15 y 196,73, respectivamente, al utilizar el kernel gaussiano.

Takeaways, Limitations

Takeaways:
Demostramos que el uso de GMM como operador de transición inversa en DDIM permite la generación de muestras de alta calidad incluso con menos pasos de muestreo.
Al conectar de manera efectiva la probabilidad marginal avanzada de DDPM y GMM a través de la técnica de coincidencia de momentos, logramos un rendimiento mejorado.
Validamos la superioridad del método propuesto a través de experimentos en conjuntos de datos a gran escala como ImageNet.
Limitations:
La restricción de los parámetros del GMM puede que sólo sea aplicable a determinados problemas.
Se necesitan más investigaciones para investigar el rendimiento de generalización del método propuesto.
Se necesitan experimentos adicionales en diferentes conjuntos de datos y modelos.
👍