Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

OSMa-Bench: Đánh giá ánh xạ ngữ nghĩa mở trong điều kiện ánh sáng khác nhau

Created by
  • Haebom

Tác giả

Maxim Popov, Regina Kurkova, Mikhail Iumanov, Jaafar Mahmoud, Sergey Kolyubin

Phác thảo

OSMa-Bench là một quy trình đánh giá Ánh xạ Ngữ nghĩa Mở (OSM) có thể cấu hình động và tự động dựa trên LLM/LVLM. Bài báo này tập trung vào việc đánh giá các thuật toán ánh xạ ngữ nghĩa tiên tiến trong các điều kiện ánh sáng trong nhà khác nhau, giới thiệu một tập dữ liệu mới chứa các chuỗi RGB-D mô phỏng và các tái tạo 3D thực tế. Chúng tôi đánh giá độ trung thực ngữ nghĩa của nhận dạng và phân đoạn đối tượng bằng các mô hình hàng đầu như ConceptGraphs, BBQ và OpenScene, đồng thời phân tích khả năng diễn giải các cấu trúc ngữ nghĩa của mô hình bằng phương pháp đánh giá đồ thị cảnh. Các kết quả thực nghiệm cung cấp cái nhìn sâu sắc về độ bền vững của mô hình và gợi ý các hướng nghiên cứu trong tương lai để phát triển các hệ thống robot linh hoạt và thích ứng.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một chuẩn mực mới (OSMa-Bench) cho phép đánh giá một cách có hệ thống hiệu suất của thuật toán OSM trong nhiều điều kiện ánh sáng khác nhau.
Có thể phân tích hiệu suất nghiêm ngặt với các tập dữ liệu RGB-D mô phỏng và tái tạo 3D chính xác.
ĐáNh giá khả năng diễn giải cấu trúc ngữ nghĩa của mô hình bằng phương pháp đánh giá đồ thị cảnh.
Phân tích điểm mạnh và điểm yếu của các mô hình OSM tiên tiến để đề xuất hướng nghiên cứu trong tương lai.
_____T134587____-:
ĐáNh giá dựa trên dữ liệu mô phỏng có thể không phản ánh đầy đủ hiệu suất trong môi trường thực tế.
Các mô hình đang được đánh giá có thể bị hạn chế.
Cần đánh giá thêm về tính khách quan và khả năng tổng quát của các phương pháp đánh giá đồ thị cảnh.
👍