Bài báo này trình bày về Điểm chuẩn Lái xe Nhận thức An toàn (SCD-Bench), một điểm chuẩn mới để đánh giá tính an toàn của các mô hình ngôn ngữ thị giác (VLM) trong các hệ thống lái xe tự động. Để giải quyết vấn đề về khả năng mở rộng của chú thích dữ liệu, chúng tôi giới thiệu Chú thích Lái xe Tự động (ADA), một hệ thống chú thích bán tự động được các chuyên gia lái xe tự động đánh giá. Thông qua quy trình đánh giá tự động, chúng tôi đạt được hơn 98% sự đồng thuận với các đánh giá của chuyên gia. Hơn nữa, chúng tôi xây dựng SCD-Training, tập dữ liệu quy mô lớn đầu tiên cho nhiệm vụ này (chứa 324.350 mẫu chất lượng cao), góp phần cải thiện khả năng nhận thức an toàn của VLM. Kết quả thực nghiệm cho thấy các mô hình được huấn luyện bằng SCD-Training vượt trội hơn SCD-Bench cũng như các điểm chuẩn chung và cụ thể theo từng lĩnh vực.