Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

LUMA: Bộ dữ liệu chuẩn để học từ dữ liệu không chắc chắn và đa phương thức

Created by
  • Haebom

Tác giả

Grigor Bezirganyan, Sana Sellami, Laure Berti- Equille, S ebastien Fournier

Phác thảo

LUMA là một tập dữ liệu mới được thiết kế để nâng cao độ tin cậy của học sâu đa phương thức, tích hợp nhiều nguồn thông tin khác nhau (văn bản, hình ảnh, âm thanh và video) nhằm cải thiện việc ra quyết định. LUMA mở rộng tập dữ liệu CIFAR-10/100 hiện có bằng cách thêm dữ liệu âm thanh và văn bản, và được thiết kế đặc biệt để cho phép truyền tải nhiều loại và mức độ không chắc chắn khác nhau, với mục tiêu học từ dữ liệu không chắc chắn. Dữ liệu âm thanh được trích xuất từ ba tập dữ liệu âm thanh, và dữ liệu văn bản được tạo bằng Gemma-7B LLM. LUMA có sẵn dưới dạng gói Python bao gồm các hàm để tạo nhiều biến thể tập dữ liệu bằng cách kiểm soát tính đa dạng của dữ liệu, lượng nhiễu trong mỗi phương thức và việc bổ sung các mẫu không phân phối. Nó cũng cung cấp một mô hình được đào tạo trước cơ sở và ba phương pháp định lượng độ không chắc chắn: Monte-Carlo Dropout, Deep Ensemble và Reliable Conflictive Multi-View Learning. Điều này hỗ trợ việc phát triển, đánh giá và đánh giá chuẩn các phương pháp học sâu đa phương thức đáng tin cậy và mạnh mẽ.

Takeaways, Limitations

Takeaways:
Nó tạo điều kiện thuận lợi cho việc phát triển các mô hình đa phương thức đáng tin cậy bằng cách cung cấp các tập dữ liệu đa phương thức có thể được đưa vào nhiều loại và mức độ không chắc chắn khác nhau.
Chúng tôi cung cấp các phương pháp định lượng sự không chắc chắn và các mô hình cơ sở cùng nhau để tăng cường sự thuận tiện cho nhà nghiên cứu.
Bạn có thể đóng góp vào việc thiết kế các phương pháp học máy đáng tin cậy và mạnh mẽ hơn cho các ứng dụng quan trọng về an toàn.
Nó được cung cấp dưới dạng một gói Python, khiến nó có khả năng truy cập và sử dụng cao.
Limitations:
Các phương pháp định lượng sự không chắc chắn hiện tại có thể còn hạn chế.
Kích thước của tập dữ liệu có thể tương đối nhỏ so với các tập dữ liệu đa phương thức lớn khác.
Có thể cần phải xác thực thêm về chất lượng và tính đa dạng của dữ liệu văn bản được tạo bằng Gemma-7B LLM.
Nó có thể không bao hàm tất cả các loại bất định.
👍