Cet article présente RAILGUN, la première politique centralisée basée sur l'apprentissage pour le problème de recherche de chemin multi-agents (MAPF). Contrairement aux méthodes d'apprentissage distribué existantes, RAILGUN utilise une architecture CNN pour concevoir une politique supervisée, permettant la généralisation sur une large gamme de tailles de cartes et de nombres d'agents. Le modèle est entraîné par apprentissage supervisé à partir de données de trajectoire collectées à partir de méthodes basées sur des règles. De nombreux résultats expérimentaux démontrent que RAILGUN surpasse les méthodes existantes et atteint d'excellentes performances de généralisation sans échec.