DriveMind는 종단간 자율주행 시스템의 해석성 부족 및 안전성 보장의 어려움을 해결하기 위해 제안된 통합 의미적 보상 프레임워크입니다. 단계별 의미적 정착을 위한 대조적 비전-언어 모델(VLM) 인코더, 의미적 변화 시 동적 프롬프트 생성을 위한 VLM 인코더-디코더(CoT 증류를 통해 미세 조정), 운동 제약 조건을 적용하는 계층적 안전 모듈, 그리고 예상 이상 상태와의 정렬을 위한 압축 예측적 세계 모델을 통합합니다. CARLA Town 2에서 19.4 +/- 2.3 km/h의 평균 속도, 0.98 +/- 0.03의 경로 완료율, 그리고 거의 제로에 가까운 충돌률을 달성하여 기준 모델보다 성공률이 4% 이상 향상되었습니다. 또한, 실제 대시캠 데이터에 대한 제로샷 일반화 성능을 보이며 실세계 배포 가능성을 보여줍니다.