Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Ultra3D: Tạo hình 3D hiệu quả và độ trung thực cao với sự chú ý đến từng chi tiết

Created by
  • Haebom

Tác giả

Yiwen Chen, Zhihao Li, Yikai Wang, Hu Zhang, Qin Li, Chi Zhang, Guosheng Lin

Phác thảo

Bài báo này đề xuất khuôn khổ Ultra3D, giúp tăng cường hiệu quả tạo nội dung 3D bằng cách sử dụng biểu diễn voxel thưa thớt. Các đường ống khuếch tán hai giai đoạn hiện có gặp phải tình trạng kém hiệu quả về mặt tính toán nghiêm trọng do độ phức tạp bậc hai của cơ chế chú ý. Ở giai đoạn đầu tiên, Ultra3D tạo ra các phác thảo vật thể thô một cách hiệu quả bằng cách sử dụng biểu diễn VecSet và giảm số lượng mã thông báo, tăng tốc độ dự đoán tọa độ khối. Ở giai đoạn thứ hai, nó giới thiệu Part Attention, một cơ chế chú ý cục bộ dựa trên nhận dạng hình học. Điều này tránh sự chú ý toàn cầu không cần thiết trong khi vẫn duy trì tính liên tục của cấu trúc bằng cách thực hiện các phép tính chú ý chỉ trong các tiểu vùng nhất quán về mặt ngữ nghĩa. Để đạt được điều này, chúng tôi xây dựng một đường ống chú thích một phần có thể mở rộng để chuyển đổi các lưới thô thành các khối thưa thớt được gắn nhãn một phần. Kết quả thử nghiệm chứng minh rằng Ultra3D hỗ trợ tạo 3D độ phân giải cao ở độ phân giải 1024x768, đạt được hiệu suất tiên tiến về độ trung thực hình ảnh và sở thích của người dùng.

Takeaways, Limitations

_____T14386____:
Tốc độ tạo mô hình 3D bằng cách sử dụng biểu diễn khối lượng thưa đã được cải thiện tới 6,7 lần so với các phương pháp hiện có.
Nó hỗ trợ việc tạo các mô hình 3D có độ phân giải cao (1024) và đạt hiệu suất tiên tiến về chất lượng hình ảnh và sở thích của người dùng.
Chúng tôi đã cải thiện đáng kể hiệu quả của việc tạo mô hình 3D bằng cách trình bày biểu diễn VecSet hiệu quả và cơ chế chú ý cục bộ nhận biết hình học (Chú ý một phần).
Hỗ trợ hiệu quả cơ chế Part Attention thông qua đường ống chú thích một phần có thể mở rộng.
Limitations:
Hiệu suất của cơ chế chú ý một phần có thể phụ thuộc vào độ chính xác của chú thích một phần. Lỗi chú thích có thể ảnh hưởng đến chất lượng tạo mô hình.
Hiệu quả của cơ chế biểu diễn VecSet và Part Attention có thể hiệu quả hơn đối với một số loại mô hình 3D nhất định và không đảm bảo cải thiện hiệu suất như nhau cho tất cả các loại mô hình.
Mặc dù hiệu suất cao ở độ phân giải 1024 pixel, chi phí tính toán có thể sẽ tăng trở lại ở độ phân giải cao hơn. Cần có thêm nghiên cứu để giải quyết vấn đề suy giảm hiệu suất liên quan đến độ phân giải cao hơn.
👍