Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
Difusión de andamios: generación de estructuras de vóxeles dispersas de múltiples categorías con difusión discreta
Created by
Haebom
Autor
Justin Jung
Describir
Este documento propone un modelo generativo llamado Scaffold Diffusion para abordar los desafíos de generar estructuras de vóxeles 3D multicategoría dispersas, específicamente el grave desequilibrio de clases causado por el escalamiento de memoria cúbica y la escasez de estructuras de vóxeles. Scaffold Diffusion trata a los vóxeles como tokens y genera estructuras de vóxeles 3D utilizando un modelo de lenguaje de difusión discreto. Demostramos que este modelo se puede extender para generar estructuras 3D espacialmente coherentes más allá de dominios inherentemente secuenciales como el texto. A través de evaluaciones en estructuras de casas de Minecraft del conjunto de datos 3D-Craft, demostramos que Scaffold Diffusion, a diferencia de los modelos de línea base existentes y las formulaciones autorregresivas, genera estructuras realistas y consistentes incluso cuando se entrena con datos con >98% de escasez. También proporcionamos un visor interactivo para visualizar las muestras generadas y el proceso de generación ( https://scaffold.deepexploration.org/ ).
Presentamos un nuevo método efectivo para generar estructuras de vóxeles 3D multicategoría dispersas.
◦
Demostrar la posibilidad de extender el modelo de lenguaje de difusión discreta para generar estructuras espaciales.
◦
Genere estructuras 3D realistas y consistentes incluso a partir de datos con una escasez superior al 98%.
◦
Proporciona un visor interactivo para visualizar el proceso de creación.
•
Limitations:
◦
Se necesitan más investigaciones para determinar el rendimiento de generalización del método propuesto a otros tipos de datos 3D o estructuras más complejas.
◦
Solo se presentan los resultados de la evaluación del conjunto de datos 3D-Craft, por lo que es necesaria la verificación del rendimiento de generalización en otros conjuntos de datos.
◦
En lugar de una solución concreta al problema de escalamiento de la memoria, adoptamos un enfoque indirecto utilizando un modelo de lenguaje de difusión discreto.