Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Ultra3D: Generación 3D eficiente y de alta fidelidad con atención a las piezas

Created by
  • Haebom

Autor

Yiwen Chen, Zhihao Li, Yikai Wang, Hu Zhang, Qin Li, Chi Zhang, Guosheng Lin

Describir

En este artículo, proponemos un marco Ultra3D que mejora la eficiencia de la generación de contenido 3D mediante la representación de celdas de volumen disperso. El modelo de difusión convencional de dos etapas presenta una grave ineficiencia computacional debido a la complejidad cuadrática del mecanismo de atención. Ultra3D genera eficientemente la disposición de los objetos en la primera etapa mediante la representación VecSet y acelera la predicción de las coordenadas de las celdas de volumen al reducir el número de tokens. En la segunda etapa, se introduce un mecanismo de atención parcial basado en reconocimiento geométrico para restringir el cálculo de la atención únicamente dentro de subregiones semánticamente consistentes, manteniendo así la continuidad estructural y evitando la atención global innecesaria. Esto logra una aceleración de hasta 6,7 veces en la generación de variables latentes, admite la generación 3D de alta resolución a 1024 y alcanza un rendimiento de vanguardia en términos de fidelidad visual y preferencias del usuario. Además, construimos una canalización de anotación parcial escalable que transforma mallas sin procesar en celdas de volumen disperso con etiquetas parciales.

Takeaways, Limitations

Takeaways:
Se mejoró significativamente la velocidad de generación de modelos 3D basados en la representación de celdas de volumen disperso (hasta 6,7 veces más velocidad)
Admite la creación de modelos 3D de alta resolución (1024).
Logra un rendimiento de última generación en términos de fidelidad visual y preferencia del usuario.
Presentamos un mecanismo de atención parcial eficiente y una canalización de anotación parcial escalable.
Limitations:
Es posible que se necesiten más estudios para explorar el rendimiento de generalización del mecanismo de atención parcial propuesto.
Es posible que se requiera un análisis más profundo de la precisión y la eficiencia del proceso de anotación parcial.
Se necesita una evaluación adicional del rendimiento de generalización para diferentes tipos de objetos 3D.
Hay una falta de análisis del uso de la memoria.
👍