Cet article présente V-Max, un cadre de recherche ouvert conçu pour accroître la praticabilité de l'apprentissage par renforcement (RL) en conduite autonome (CA). Il vise à surmonter les difficultés de l'apprentissage par imitation (IL) conventionnel et l'absence d'un environnement de recherche standardisé et efficace pour l'application de l'RL à la conduite autonome. V-Max s'appuie sur Waymax, un simulateur de conduite autonome accéléré par matériel conçu pour les expériences à grande échelle, et exploite l'approche ScenarioNet pour permettre une simulation rapide de divers ensembles de données de conduite autonome. Il vise à réduire la charge d'ingénierie des approches basées sur des règles en permettant des politiques de conduite autonome généralisables.