En este artículo, proponemos un marco Ultra3D que mejora la eficiencia de la generación de contenido 3D mediante la representación de celdas de volumen disperso. El modelo de difusión convencional de dos etapas presenta una grave ineficiencia computacional debido a la complejidad cuadrática del mecanismo de atención. Ultra3D genera eficientemente la disposición de los objetos en la primera etapa mediante la representación VecSet y acelera la predicción de las coordenadas de las celdas de volumen al reducir el número de tokens. En la segunda etapa, se introduce un mecanismo de atención parcial basado en reconocimiento geométrico para restringir el cálculo de la atención únicamente dentro de subregiones semánticamente consistentes, manteniendo así la continuidad estructural y evitando la atención global innecesaria. Esto logra una aceleración de hasta 6,7 veces en la generación de variables latentes, admite la generación 3D de alta resolución a 1024 y alcanza un rendimiento de vanguardia en términos de fidelidad visual y preferencias del usuario. Además, construimos una canalización de anotación parcial escalable que transforma mallas sin procesar en celdas de volumen disperso con etiquetas parciales.