Este artículo presenta RAILGUN, la primera política centralizada basada en aprendizaje para el problema de búsqueda de rutas multiagente (MAPF). A diferencia de los métodos existentes basados en aprendizaje distribuido, RAILGUN utiliza una arquitectura basada en CNN para diseñar una política supervisada, lo que permite la generalización en una amplia gama de tamaños de mapas y números de agentes. El modelo se entrena mediante aprendizaje supervisado con datos de trayectoria recopilados mediante métodos basados en reglas. Amplios resultados experimentales demuestran que RAILGUN supera a los métodos existentes y logra un excelente rendimiento de generalización de disparo cero.