Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Phong cách hóa đầu 3D bảo toàn bản sắc với chưng cất điểm số đa chế độ xem

Created by
  • Haebom

Tác giả

Bahri Batuhan Bilecen, Ahmet Berke Gokmen, Furkan Guzelant, Aysegul Dundar

Phác thảo

Bài báo này trình bày một khuôn khổ mới cho việc tạo kiểu đầu 3D, giải quyết những thách thức của các phương pháp hiện có, vốn chủ yếu dựa vào ảnh chụp chính diện và duy trì tính cá nhân. Chúng tôi tổng hợp ảnh với trường nhìn 360 độ bằng mô hình PanoHead, và tích hợp các kỹ thuật chưng cất log-likelihood âm (LD), điểm lưới đa góc nhìn, gradient gương và trọng số hạng điểm vào kiến ​​trúc mạng đối nghịch sinh sản 3D (GAN) để cải thiện chất lượng bảo tồn tính cá nhân và tạo kiểu. Điều này cung cấp cái nhìn sâu sắc về quy trình chưng cất hiệu quả giữa các mô hình khuếch tán và GAN, đặc biệt tập trung vào việc bảo tồn tính cá nhân.

Takeaways, Limitations

Takeaways:
Mở rộng khả năng tạo kiểu từ nhiều góc độ khác nhau bằng cách sử dụng trường nhìn 360 độ.
Duy trì cá tính và cải thiện chất lượng kiểu dáng thông qua phương pháp chưng cất log-likelihood âm (LD).
Kiến trúc GAN 3D được cải tiến bằng cách sử dụng điểm lưới đa chế độ xem và độ dốc phản chiếu.
Cung cấp những hiểu biết mới về quá trình chưng cất hiệu quả giữa các mô hình khuếch tán và GAN.
Limitations:
Vì cấu trúc phụ thuộc vào mô hình PanoHead nên có khả năng hiệu suất sẽ giảm khi áp dụng các mô hình 3D khác.
Cần phải xác nhận thêm hiệu suất tổng quát của phương pháp đề xuất.
Thiếu đánh giá hiệu suất trên các tập dữ liệu lớn.
👍