본 논문은 자율 주행(AD)에서 강화 학습(RL)의 실용성을 높이기 위해 설계된 오픈 리서치 프레임워크인 V-Max를 소개한다. 기존의 모방 학습(IL)의 한계점(데이터 분포 차이, 모방 간극)을 극복하고, RL의 자율 주행 적용을 위한 표준화되고 효율적인 연구 환경 부족 문제를 해결하고자 한다. V-Max는 대규모 실험을 위해 설계된 하드웨어 가속 AD 시뮬레이터인 Waymax를 기반으로 구축되며, 다양한 AD 데이터셋의 빠른 시뮬레이션을 가능하게 하는 ScenarioNet의 접근 방식을 활용한다. 이는 일반화 가능한 자율 주행 정책을 가능하게 하여 규칙 기반 접근 방식의 엔지니어링 오버헤드를 줄이는 것을 목표로 한다.