Bài báo này đề xuất khuôn khổ Ultra3D, giúp tăng cường hiệu quả tạo nội dung 3D bằng cách sử dụng biểu diễn voxel thưa thớt. Các đường ống khuếch tán hai giai đoạn hiện có gặp phải tình trạng kém hiệu quả về mặt tính toán nghiêm trọng do độ phức tạp bậc hai của cơ chế chú ý. Ở giai đoạn đầu tiên, Ultra3D tạo ra các phác thảo vật thể thô một cách hiệu quả bằng cách sử dụng biểu diễn VecSet và giảm số lượng mã thông báo, tăng tốc độ dự đoán tọa độ khối. Ở giai đoạn thứ hai, nó giới thiệu Part Attention, một cơ chế chú ý cục bộ dựa trên nhận dạng hình học. Điều này tránh sự chú ý toàn cầu không cần thiết trong khi vẫn duy trì tính liên tục của cấu trúc bằng cách thực hiện các phép tính chú ý chỉ trong các tiểu vùng nhất quán về mặt ngữ nghĩa. Để đạt được điều này, chúng tôi xây dựng một đường ống chú thích một phần có thể mở rộng để chuyển đổi các lưới thô thành các khối thưa thớt được gắn nhãn một phần. Kết quả thử nghiệm chứng minh rằng Ultra3D hỗ trợ tạo 3D độ phân giải cao ở độ phân giải 1024x768, đạt được hiệu suất tiên tiến về độ trung thực hình ảnh và sở thích của người dùng.