Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

OE3DIS: Phân đoạn phiên bản đám mây điểm 3D mở

Created by
  • Haebom

Tác giả

Phúc DA Nguyễn, Minh Lưu, Anh Trần, Cường Phạm, Khôi Nguyên

Phác thảo

Bài báo này trình bày bài toán Phân đoạn thể hiện 3D loại mở (OE-3DIS), cho phép phân đoạn đối tượng mới mà không cần tên lớp được xác định trước. Các phương pháp phân đoạn thể hiện 3D từ vựng mở (OV-3DIS) hiện có gặp phải hạn chế là phải dựa vào tên lớp được xác định trước trong quá trình thử nghiệm; OE-3DIS khắc phục hạn chế này. Chúng tôi xây dựng một mô hình cơ sở mạnh mẽ bằng cách tận dụng phương pháp OV-3DIS và mô hình ngôn ngữ quy mô lớn đa phương thức 2D, đồng thời đánh giá hiệu suất của mô hình này bằng Điểm loại mở mới và điểm AP chuẩn hóa, đánh giá chất lượng ngữ nghĩa và hình học của mặt nạ dự đoán và tên lớp liên quan của chúng. Trên các tập dữ liệu ScanNet200 và ScanNet++, chúng tôi đạt được những cải tiến hiệu suất đáng kể so với mô hình cơ sở và thậm chí còn vượt trội hơn phương pháp OV-3DIS tiên tiến trước đây là Open3DIS.

Takeaways, Limitations

Takeaways:
Bằng cách xác định vấn đề OE-3DIS, cho phép phân đoạn phiên bản 3D mà không cần tên lớp được xác định trước, đồng thời trình bày mô hình cơ sở mạnh mẽ cùng các số liệu đánh giá cho vấn đề này, chúng tôi góp phần vào sự phát triển của các hệ thống nhận dạng đối tượng 3D tự động hơn.
Cải thiện hiệu suất phân đoạn phiên bản 3D bằng cách sử dụng các mô hình ngôn ngữ đa phương thức 2D quy mô lớn.
ĐIểm số mở mới cho phép đánh giá toàn diện về chất lượng ngữ nghĩa và hình học.
ĐạT được hiệu suất vượt trội hơn các mẫu máy hiện có hiệu suất cao nhất.
Limitations:
Cần có thêm các thí nghiệm để đánh giá hiệu suất tổng quát của phương pháp đề xuất.
Cần có thêm đánh giá hiệu suất trên nhiều tập dữ liệu 3D khác nhau.
Do phụ thuộc nhiều vào các mô hình ngôn ngữ quy mô lớn đa phương thức 2D nên những hạn chế của các mô hình này có thể ảnh hưởng đến hiệu suất của OE-3DIS.
👍