Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Difusión de Gibbs entrelazada: generación de datos discretos-continuos con restricciones implícitas

Created by
  • Haebom

Autor

Gautham Govind Anil, Sachin Yadav, Dheeraj Nagaraj, Karthikeyan Shanmugam, Prateek Jain

Describir

La Difusión de Gibbs Intercalada (IGD) es un novedoso marco de modelado generativo para datos discretos-continuos, centrado en problemas con restricciones importantes, implícitas y no especificadas en los datos. La mayoría de los estudios previos sobre difusión discreta y discreta-continua asumen una distribución de denoiser factorizable, lo que puede dificultar el modelado de fuertes dependencias entre variables aleatorias en estos problemas. En este artículo, demostramos experimentalmente una mejora significativa en el rendimiento de 3-SAT al cambiar a un modelo de difusión discreta de muestreo de Gibbs que no asume factorabilidad. Inspirados por esto, presentamos IGD, que generaliza cadenas de Markov de muestreo de Gibbs de tiempo discreto para la generación discreto-continua. IGD permite una integración fluida entre denoisers discretos y continuos, a la vez que garantiza teóricamente la inversión exacta del proceso directo apropiado. También proporciona flexibilidad en la elección de denoisers y permite la generación condicional mediante la duplicación del espacio de estados y la mejora del tiempo de inferencia. Evaluaciones experimentales en tres desafiantes tareas de generación (estructura molecular, diseño y datos tabulares) demuestran un rendimiento de vanguardia. En particular, IGD logra resultados de vanguardia sin depender de sesgos inductivos específicos del dominio, como la difusión equivariante o la pérdida auxiliar. En este artículo, exploramos diferentes estrategias de modelado e intercalado, e hiperparámetros para cada uno de estos problemas.

Takeaways, Limitations

Takeaways:
Presentamos IGD, un novedoso marco de modelado generativo para datos discretos-continuos.
Manejar eficazmente las restricciones implícitas en los datos.
Permite el modelado robusto de dependencias entre variables sin asumir la posibilidad de adquisición.
Mejora del rendimiento sobre los métodos existentes en problemas 3-SAT.
Logre un rendimiento de última generación en una variedad de tareas que incluyen estructuras moleculares, diseños y datos tabulares.
Lograr resultados de última generación sin depender de sesgos inductivos específicos del dominio.
Limitations:
Se necesitan más investigaciones para determinar la generalización de los resultados experimentales presentados en este artículo.
Se necesita más investigación sobre la aplicabilidad y escalabilidad de IGD a varios tipos de datos y configuraciones de problemas.
Falta de explicación detallada y análisis del ajuste de hiperparámetros.
No se puede descartar por completo la posibilidad de que exista un sesgo inductivo hacia un dominio específico.
👍