Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Ultra3D: Tạo hình 3D hiệu quả và độ trung thực cao với sự chú ý đến từng chi tiết

Created by
  • Haebom

Tác giả

Yiwen Chen, Zhihao Li, Yikai Wang, Hu Zhang, Qin Li, Chi Zhang, Guosheng Lin

Phác thảo

Bài báo này đề xuất Ultra3D, một khuôn khổ tạo nội dung 3D hiệu quả tận dụng các biểu diễn ô khối lượng thưa thớt. Các đường ống khuếch tán hai giai đoạn thông thường gặp phải tình trạng kém hiệu quả tính toán nghiêm trọng do độ phức tạp bậc hai của cơ chế chú ý. Để giải quyết vấn đề này, Ultra3D tận dụng biểu diễn VecSet để tạo bố cục đối tượng một cách hiệu quả trong giai đoạn đầu tiên và tăng tốc dự đoán tọa độ ô khối lượng bằng cách giảm số lượng mã thông báo. Trong giai đoạn thứ hai, Part Attention, một cơ chế chú ý cục bộ nhận biết hình học, được giới thiệu để hạn chế các tính toán chú ý trong các vùng con nhất quán về mặt ngữ nghĩa, do đó tránh sự chú ý toàn cầu không cần thiết trong khi vẫn duy trì tính liên tục của cấu trúc. Để đạt được điều này, chúng tôi xây dựng một đường ống chú thích một phần có khả năng mở rộng để chuyển đổi các lưới thô thành các ô khối lượng thưa thớt với các nhãn một phần. Kết quả thử nghiệm chứng minh rằng Ultra3D hỗ trợ tạo 3D độ phân giải cao ở độ phân giải 1024x768 và đạt được hiệu suất tiên tiến về độ trung thực hình ảnh và khả năng chấp nhận của người dùng.

Takeaways, Limitations

Takeaways:
Chúng tôi đã giải quyết hiệu quả vấn đề kém hiệu quả về mặt tính toán của các mô hình tạo 3D hiện có thông qua cơ chế biểu diễn VecSet và Part Attention.
Nó hỗ trợ việc tạo các mô hình 3D có độ phân giải cao (1024) và mang lại hiệu suất vượt trội về chất lượng hình ảnh và sở thích của người dùng.
Cung cấp một đường ống chú thích một phần có thể mở rộng để tạo điều kiện thuận lợi cho việc sử dụng cơ chế Chú ý một phần.
ĐạT được tốc độ tăng lên tới 6,7 lần.
Limitations:
Hiệu suất của cơ chế Chú ý Phần có thể phụ thuộc vào độ chính xác của chú thích từng phần. Lỗi trong chú thích từng phần có thể ảnh hưởng đến chất lượng kết quả cuối cùng được tạo ra.
Hiệu quả của phương pháp đề xuất có thể bị giới hạn ở một số loại mô hình 3D nhất định. Cần nghiên cứu thêm để xác định hiệu suất khái quát hóa của phương pháp trên nhiều loại mô hình 3D khác nhau.
Vì thiết kế của cơ chế Part Attention giả định rằng các bộ phận được chia theo một cách cụ thể nên khả năng áp dụng của cơ chế này cho nhiều loại đối tượng khác nhau có thể bị hạn chế.
👍