Cet article présente le Safety Cognition Driving Benchmark (SCD-Bench), un nouveau benchmark permettant d'évaluer la sécurité des modèles vision-langage (VLM) dans les systèmes de conduite autonome. Pour répondre au problème d'évolutivité de l'annotation des données, nous introduisons Autonomous Driving Annotation (ADA), un système d'annotation semi-automatisé évalué par des experts en conduite autonome. Grâce à un pipeline d'évaluation automatisé, nous obtenons une concordance de plus de 98 % avec les jugements des experts humains. De plus, nous construisons SCD-Training, le premier ensemble de données à grande échelle pour cette tâche (contenant 324 350 échantillons de haute qualité), contribuant ainsi à améliorer les capacités cognitives de sécurité des VLM. Les résultats expérimentaux montrent que les modèles entraînés avec SCD-Training surpassent SCD-Bench ainsi que les benchmarks généraux et spécifiques à un domaine.