본 논문은 현재 Vision-Language Model (VLM) 기반 자율 주행 시스템의 실질적인 유효성을 평가하기 위해, end-to-end 궤적 예측 작업에 초점을 맞춘 최초의 견고성 벤치마크인 RoboDriveBench를 소개합니다. 이 벤치마크는 환경 변화로 인한 센서 손상 6가지 시나리오와, 인간의 개입 및 데이터 전송 실패로 인한 프롬프트 손상 5가지 시나리오를 포함하는 11개의 시뮬레이션 시나리오를 통해 VLM 기반 end-to-end 자율 주행 시스템에 대한 두 가지 주요 실세계 문제를 체계적으로 평가합니다. 또한, 다중 모달 데이터를 통합하는 RoboDriveVLM이라는 새로운 VLM 기반 자율 주행 프레임워크와, 상호 모달 지식 증류를 기반으로 하는 새로운 Test-Time Adaptation (TTA) 방법을 제안하여 VLM 기반 자율 주행 시스템의 견고성을 향상시킵니다.