Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Hợp nhất dữ liệu cảm biến đa phương thức dựa trên cạnh với mô hình ngôn ngữ thị giác (VLM) để tránh tai nạn xe tự hành theo thời gian thực

Created by
  • Haebom

Tác giả

Fengze Yang, Bo Yu, Yang Chu, Xuewen Luo, Zhengzhong Tu, Chenxi Liu

Phác thảo

Bài báo này đề xuất REACT (Real-time Edge-based Autonomous Co-pilot Trajectory Planner), một khuôn khổ lập kế hoạch quỹ đạo dựa trên mô hình ngôn ngữ thị giác nhẹ, thời gian thực, tích hợp giao tiếp giữa xe và mọi thứ (V2X) để khắc phục những hạn chế về phát hiện của các hệ thống lái xe tự động. REACT tinh chỉnh một mô hình ngôn ngữ thị giác nhẹ (VLM) để tích hợp các cảnh báo nguy hiểm do cơ sở hạ tầng cung cấp với dữ liệu cảm biến trong xe, hiểu được động lực giao thông phức tạp và ý định của xe thông qua nhúng hình ảnh, diễn giải dữ liệu số chính xác từ các đầu vào biểu tượng và tạo ra các quỹ đạo tối ưu, tập trung vào an toàn thông qua suy luận nhạy cảm với ngữ cảnh. Đối với việc triển khai thời gian thực, REACT sử dụng thiết kế hợp nhất đường dẫn còn lại (RTF) và chiến lược thích ứng biên chuyên biệt để giảm độ phức tạp của mô hình và cải thiện hiệu quả suy luận. Kết quả đánh giá trên điểm chuẩn DeepAccident chứng minh hiệu suất tiên tiến, đạt được mức giảm 77% tỷ lệ va chạm, cải thiện 48,2% Chất lượng toàn cảnh video (VPQ) và độ trễ suy luận 0,57 giây.

Takeaways, Limitations

Takeaways:
Thể hiện hiệu quả của việc lập kế hoạch cộng tác theo thời gian thực bằng cách sử dụng VLM nhẹ.
Đề Xuất khả năng cải thiện an toàn giao thông và khả năng phản ứng thông qua suy luận tình huống dựa trên ngôn ngữ.
Khắc phục những hạn chế trong phát hiện của hệ thống lái xe tự động thông qua tích hợp V2X.
Cải thiện hiệu suất theo thời gian thực thông qua các chiến lược thích ứng biên và RTF.
ĐạT được hiệu suất tiên tiến nhất trên chuẩn mực DeepAccident.
Limitations:
Cần xác minh hiệu suất tổng quát cho các môi trường cụ thể của điểm chuẩn DeepAccident.
Cần có thêm nghiên cứu về độ bền trong nhiều điều kiện thời tiết khác nhau và tình huống giao thông phức tạp.
Cần nghiên cứu thêm về khả năng ứng dụng thực tế do hạn chế về hiệu suất của các thiết bị biên.
Hiệu suất có thể giảm do dữ liệu đào tạo bị sai lệch trong VLM.
👍