Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Scaffold Diffusion: Tạo cấu trúc Voxel đa thể loại thưa thớt với sự khuếch tán rời rạc

Created by
  • Haebom

Tác giả

Justin Jung

Phác thảo

Bài báo này đề xuất một mô hình sinh ra có tên là Scaffold Diffusion để giải quyết những thách thức trong việc tạo ra các cấu trúc voxel 3D đa danh mục thưa thớt, đặc biệt là sự mất cân bằng lớp nghiêm trọng do tỷ lệ bộ nhớ khối và độ thưa thớt của các cấu trúc voxel. Scaffold Diffusion coi các voxel như các mã thông báo và tạo ra các cấu trúc voxel 3D bằng cách sử dụng mô hình ngôn ngữ khuếch tán rời rạc. Chúng tôi chứng minh rằng mô hình này có thể được mở rộng để tạo ra các cấu trúc 3D mạch lạc về mặt không gian vượt ra ngoài các miền tuần tự vốn có như văn bản. Thông qua các đánh giá về các cấu trúc nhà Minecraft từ bộ dữ liệu 3D-Craft, chúng tôi chứng minh rằng Scaffold Diffusion, không giống như các mô hình cơ sở hiện có và các công thức tự hồi quy, tạo ra các cấu trúc thực tế và nhất quán ngay cả khi được đào tạo bằng dữ liệu có độ thưa thớt >98%. Chúng tôi cũng cung cấp một trình xem tương tác để trực quan hóa các mẫu được tạo ra và quy trình tạo ( https://scaffold.deepexploration.org/ ).

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một phương pháp mới hiệu quả để tạo ra các cấu trúc voxel 3D đa loại thưa thớt.
Thể hiện khả năng mở rộng mô hình ngôn ngữ khuếch tán rời rạc để tạo ra các cấu trúc không gian.
Tạo ra các cấu trúc 3D thực tế và nhất quán ngay cả từ dữ liệu có độ thưa thớt lớn hơn 98%.
Cung cấp trình xem tương tác để trực quan hóa quá trình sáng tạo.
Limitations:
Cần nghiên cứu thêm để xác định hiệu suất tổng quát của phương pháp đề xuất đối với các loại dữ liệu 3D khác hoặc các cấu trúc phức tạp hơn.
Chỉ có kết quả đánh giá cho tập dữ liệu 3D-Craft được trình bày, do đó cần phải xác minh hiệu suất tổng quát hóa trên các tập dữ liệu khác.
Thay vì một giải pháp cụ thể cho vấn đề mở rộng bộ nhớ, chúng tôi áp dụng cách tiếp cận vòng vo bằng cách sử dụng mô hình ngôn ngữ khuếch tán rời rạc.
👍