[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Lập kế hoạch quỹ đạo mô phỏng được tăng cường cho việc lái xe tự động trong đô thị

Created by
  • Haebom

Tác giả

ĐịCh Tằng, Lăng Chính, Tiên Thông Dương, Yinong Li

Phác thảo

Bài báo này đề xuất một phương pháp mới để giải quyết vấn đề các phương pháp dựa trên RL hiện có kém hiệu quả hơn các phương pháp dựa trên học mô phỏng do vấn đề hội tụ của RL và khó khăn trong việc thiết kế hàm thưởng trong quy hoạch đường đi cho xe tự hành đô thị dựa trên học tăng cường (RL). Để khắc phục những hạn chế của các phương pháp hiện có, bao gồm quy hoạch một bước và giả định hàm thưởng tuyến tính, chúng tôi tích hợp RL và học mô phỏng để cho phép quy hoạch nhiều bước, đồng thời phát triển một hàm thưởng Bayesian dựa trên biến đổi để cung cấp tín hiệu thưởng hiệu quả trong môi trường đô thị. Ngoài ra, chúng tôi đề xuất một khuôn khổ quy hoạch đường đi dựa trên kết hợp để cải thiện tính an toàn và khả năng diễn giải. Kết quả thử nghiệm sử dụng tập dữ liệu nuPlan cho thấy phương pháp đề xuất vượt trội hơn các phương pháp hiện có.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một phương pháp mới để giải quyết hiệu quả các vấn đề hội tụ và các vấn đề thiết kế hàm phần thưởng trong quy hoạch lộ trình lái xe tự động trong đô thị dựa trên RL.
ĐạT được kế hoạch nhiều giai đoạn và cải thiện hiệu suất thông qua việc tích hợp học tập thực tế và học tập bắt chước.
Cung cấp tín hiệu bù phù hợp với môi trường đô thị thông qua hàm thưởng Bayesian dựa trên máy biến áp.
Cải thiện tính an toàn và khả năng diễn giải thông qua khuôn khổ kết hợp.
Xác minh hiệu suất thông qua các thử nghiệm sử dụng bộ dữ liệu lái xe tự động trong đô thị thực tế quy mô lớn (nuPlan).
Phát hành mã nguồn mở.
Limitations:
Cần nghiên cứu thêm về hiệu suất tổng quát của phương pháp đề xuất.
Cần đánh giá độ bền vững cho nhiều môi trường và tình huống đô thị khác nhau.
Cần phải phân tích sâu hơn về chi phí tính toán và hiệu suất xử lý thời gian thực.
👍