Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

RAILGUN: Chính sách tích chập thống nhất cho việc tìm đường dẫn đa tác nhân trên nhiều môi trường và tác vụ khác nhau

Created by
  • Haebom

Tác giả

Yimin Tang, Xiao Xiong, Jingyi Xi, Jiaoyang Li, Erdem B{\i}y{\i}k, Sven Koenig

Phác thảo

Bài báo này trình bày RAILGUN, chính sách học tập tập trung đầu tiên cho bài toán tìm đường đa tác tử (MAPF). Không giống như các phương pháp học tập phân tán hiện có, RAILGUN sử dụng kiến trúc dựa trên CNN để thiết kế chính sách có giám sát, cho phép khái quát hóa trên nhiều kích thước bản đồ và số lượng tác tử. Mô hình được huấn luyện bằng học tập có giám sát, sử dụng dữ liệu quỹ đạo thu thập từ các phương pháp dựa trên quy tắc. Các kết quả thử nghiệm mở rộng chứng minh rằng RAILGUN vượt trội hơn các phương pháp hiện có và đạt hiệu suất khái quát hóa zero-shot tuyệt vời.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày chính sách học tập tập trung đầu tiên cho vấn đề tìm đường của nhiều tác nhân.
Thể hiện khả năng khái quát hóa trên nhiều kích thước bản đồ và số lượng tác nhân khác nhau bằng các chính sách dựa trên bản đồ.
Đã đượC kiểm chứng bằng thực nghiệm rằng hiệu suất khái quát hóa bằng zero-shot là tuyệt vời.
ĐạT được hiệu suất vượt trội so với các phương pháp hiện có
Limitations:
Dựa vào các phương pháp học có giám sát sử dụng dữ liệu thu thập được từ các phương pháp dựa trên quy tắc.
Thiếu mô tả chi tiết về kiến trúc và quy trình đào tạo của RAILGUN (cần thêm thông tin)
Thiếu sự xác thực về hiệu suất tổng quát hóa cho các loại vấn đề MAPF khác (ví dụ: môi trường động).
👍