Trong bài báo này, chúng tôi đề xuất một khuôn khổ Ultra3D giúp cải thiện hiệu quả tạo nội dung 3D bằng cách sử dụng biểu diễn ô thể tích thưa thớt. Mô hình khuếch tán hai giai đoạn thông thường gặp phải tình trạng kém hiệu quả tính toán nghiêm trọng do độ phức tạp bậc hai của cơ chế chú ý. Ultra3D tạo bố cục đối tượng một cách hiệu quả trong giai đoạn đầu tiên bằng cách sử dụng biểu diễn VecSet và tăng tốc dự đoán tọa độ ô thể tích bằng cách giảm số lượng mã thông báo. Ở giai đoạn thứ hai, một cơ chế chú ý một phần dựa trên nhận dạng hình học được giới thiệu để hạn chế tính toán chú ý chỉ trong các tiểu vùng nhất quán về mặt ngữ nghĩa, do đó duy trì tính liên tục của cấu trúc và tránh sự chú ý toàn cục không cần thiết. Điều này đạt được tốc độ tăng lên tới 6,7 lần trong việc tạo biến tiềm ẩn, hỗ trợ tạo 3D độ phân giải cao ở độ phân giải 1024 và đạt được hiệu suất tiên tiến về độ trung thực hình ảnh và sở thích của người dùng. Ngoài ra, chúng tôi xây dựng một đường ống chú thích một phần có khả năng mở rộng, chuyển đổi các lưới thô thành các ô thể tích thưa thớt với các nhãn một phần.