Bài báo này trình bày RAILGUN, chính sách học tập tập trung đầu tiên cho bài toán tìm đường đa tác tử (MAPF). Không giống như các phương pháp học tập phân tán hiện có, RAILGUN sử dụng kiến trúc dựa trên CNN để thiết kế chính sách có giám sát, cho phép khái quát hóa trên nhiều kích thước bản đồ và số lượng tác tử. Mô hình được huấn luyện bằng học tập có giám sát, sử dụng dữ liệu quỹ đạo thu thập từ các phương pháp dựa trên quy tắc. Các kết quả thử nghiệm mở rộng chứng minh rằng RAILGUN vượt trội hơn các phương pháp hiện có và đạt hiệu suất khái quát hóa zero-shot tuyệt vời.