Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

ĐáNh giá khả năng nhận thức an toàn trong các mô hình ngôn ngữ thị giác dành cho xe tự hành

Created by
  • Haebom

Tác giả

ÂN Minh Trương, Peizhe Gong, Xingyuan Dai, Min Huang, Yisheng Lv, Qinghai Miao

Phác thảo

Bài báo này trình bày về Điểm chuẩn Lái xe Nhận thức An toàn (SCD-Bench), một điểm chuẩn mới để đánh giá tính an toàn của các mô hình ngôn ngữ thị giác (VLM) trong các hệ thống lái xe tự động. Để giải quyết vấn đề về khả năng mở rộng của chú thích dữ liệu, chúng tôi giới thiệu Chú thích Lái xe Tự động (ADA), một hệ thống chú thích bán tự động được các chuyên gia lái xe tự động đánh giá. Thông qua quy trình đánh giá tự động, chúng tôi đạt được hơn 98% sự đồng thuận với các đánh giá của chuyên gia. Hơn nữa, chúng tôi xây dựng SCD-Training, tập dữ liệu quy mô lớn đầu tiên cho nhiệm vụ này (chứa 324.350 mẫu chất lượng cao), góp phần cải thiện khả năng nhận thức an toàn của VLM. Kết quả thực nghiệm cho thấy các mô hình được huấn luyện bằng SCD-Training vượt trội hơn SCD-Bench cũng như các điểm chuẩn chung và cụ thể theo từng lĩnh vực.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một chuẩn mực mới (SCD-Bench) và một tập dữ liệu đào tạo quy mô lớn (SCD-Training) để đánh giá khả năng nhận thức an toàn của VLM trong môi trường lái xe tự động.
Cải thiện hiệu quả và khả năng mở rộng của chú thích dữ liệu bằng hệ thống chú thích bán tự động (ADA).
Có thể thực hiện đánh giá nhất quán thông qua quy trình đánh giá tự động.
Các mô hình được đào tạo bằng SCD-Training chứng minh hiệu suất được cải thiện trên nhiều tiêu chuẩn khác nhau, cho thấy tiềm năng của chúng trong việc góp phần cải thiện tính an toàn của hệ thống lái xe tự động.
Limitations:
Cần có thêm xác nhận về giới hạn độ chính xác của hệ thống ADA và tính chủ quan của đánh giá chuyên môn.
Cần nghiên cứu thêm để xác định khả năng khái quát hóa của các tập dữ liệu SCD-Bench và SCD-Training. Chúng có thể bị sai lệch trong các môi trường hoặc tình huống cụ thể.
Cần nghiên cứu thêm để xác minh tính an toàn trong môi trường lái xe tự động thực tế. Điều này đòi hỏi phải xác minh kết quả chuẩn mực phù hợp với các tình huống thực tế như thế nào.
👍