Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

OC-SOP: Nâng cao khả năng dự đoán vị trí ngữ nghĩa 3D dựa trên tầm nhìn bằng nhận thức lấy đối tượng làm trung tâm

Created by
  • Haebom

Tác giả

Helin Cao, Sven Behnke

Phác thảo

Bài báo này trình bày nhiệm vụ Dự đoán Chiếm dụng Ngữ nghĩa (SOP), đồng thời suy ra hình học cảnh và nhãn ngữ nghĩa từ hình ảnh để giải quyết các thách thức về che khuất vật thể và dữ liệu cảnh không đầy đủ trong các hệ thống nhận thức lái xe tự động. Để khắc phục những hạn chế của các phương pháp dựa trên camera hiện có, vốn xử lý tất cả các hạng mục một cách bình đẳng và chủ yếu dựa vào các đặc điểm cục bộ, dẫn đến hiệu suất dự đoán kém, đặc biệt là đối với các vật thể tiền cảnh động, chúng tôi đề xuất một khuôn khổ SOP Lấy Đối tượng Làm Trung tâm (OC-SOP). OC-SOP cải thiện đáng kể độ chính xác dự đoán đối tượng tiền cảnh bằng cách kết hợp các tín hiệu lấy đối tượng làm trung tâm cấp cao được trích xuất thông qua các nhánh phát hiện vào quy trình dự đoán chiếm dụng ngữ nghĩa, đạt được hiệu suất tiên tiến trên tất cả các hạng mục trên tập dữ liệu SemanticKITTI.

Takeaways, Limitations

Takeaways:
Chúng tôi đã cải thiện độ chính xác của dự đoán vị trí ngữ nghĩa, đặc biệt là dự đoán đối tượng tiền cảnh động, bằng cách kết hợp các tín hiệu lấy đối tượng làm trung tâm.
ĐạT được hiệu suất tiên tiến nhất trên tập dữ liệu SemanticKITTI.
Nó có thể góp phần cải thiện hiệu suất của hệ thống nhận thức lái xe tự động.
Limitations:
Hiệu suất của phương pháp đề xuất có thể bị giới hạn ở một tập dữ liệu cụ thể (SemanticKITTI).
Cần phải xác nhận thêm hiệu suất tổng quát hóa trong môi trường thực tế.
Vì nó có thể phụ thuộc vào hiệu suất của nhánh phát hiện nên lỗi trong nhánh phát hiện có thể ảnh hưởng đến hiệu suất chung của hệ thống.
👍