Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới. Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận. Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.
RALAD: Thu hẹp khoảng cách giữa thực tế và mô phỏng trong lái xe tự động bằng công nghệ học tập tăng cường truy xuất
Created by
Haebom
Tác giả
Gia Thành Zuo, Haibo Hu, Zikang Chu, Yufei Cui, Ziquan Liu, Jianping Wang, Nan Guan, Jin Wang, Chun Jason Xue
Phác thảo
Để Cải thiện tính mạnh mẽ của các hệ thống lái xe tự động, các mô hình được huấn luyện trên các tập dữ liệu thực tế gặp khó khăn trong việc thích ứng với môi trường mới khi đối mặt với các tình huống đặc biệt như điều kiện thời tiết khắc nghiệt. Do khó thu thập các tình huống đặc biệt như vậy trong môi trường thực tế, nên phải sử dụng các trình mô phỏng để xác thực. Tuy nhiên, chi phí tính toán cao và khoảng cách miền trong phân phối dữ liệu đã khiến việc chuyển đổi trơn tru giữa các tình huống lái xe thực tế và mô phỏng trở nên khó khăn. Để giải quyết những vấn đề này, trong bài báo này, chúng tôi đề xuất một khuôn khổ mới, Học tăng cường truy xuất cho lái xe tự động (RALAD), được thiết kế để thu hẹp khoảng cách giữa môi trường thực tế và mô phỏng với chi phí thấp. RALAD có ba tính năng thiết kế chính: thích ứng miền thông qua phương pháp truyền tối ưu (OT) được cải tiến, xem xét cả khoảng cách ảnh riêng lẻ và nhóm, một khuôn khổ đơn giản và thống nhất có thể áp dụng cho nhiều mô hình khác nhau, và một kỹ thuật tinh chỉnh hiệu quả, duy trì tính mạnh mẽ đồng thời sửa các lớp tốn kém về mặt tính toán. Kết quả thực nghiệm chứng minh rằng RALAD bù đắp cho sự suy giảm hiệu suất trong môi trường mô phỏng, đồng thời duy trì độ chính xác của các tình huống thực tế trên ba mô hình khác nhau. Lấy Cross View làm ví dụ, trong các tình huống thực tế, các chỉ số mIOU và mAP vẫn ổn định trước và sau khi tinh chỉnh RALAD, trong khi trong môi trường mô phỏng, các chỉ số mIOU và mAP được cải thiện lần lượt 10,30% và 12,29%. Ngoài ra, chi phí đào tạo lại phương pháp của chúng tôi giảm khoảng 88,1%. Mã có thể được tìm thấy tại https://github.com/JiachengZuo/RALAD.git .
Thu hẹp khoảng cách giữa thực tế và mô phỏng thông qua việc điều chỉnh miền hiệu quả bằng các phương pháp chuyển giao tối ưu (OT) được cải tiến.
◦
Nó cung cấp một khuôn khổ đơn giản, thống nhất có thể áp dụng cho nhiều mô hình khác nhau.
◦
Cho phép tinh chỉnh hiệu quả bằng cách ghim các lớp tốn nhiều tài nguyên tính toán.
◦
ĐạT được hiệu suất được cải thiện (cải thiện số liệu mIOU và mAP) và giảm chi phí đào tạo lại trong môi trường mô phỏng.
◦
Cải thiện hiệu suất môi trường mô phỏng mà không ảnh hưởng đến hiệu suất thực tế.
•
Limitations:
◦
Cần nghiên cứu thêm để đánh giá hiệu suất tổng quát của phương pháp đề xuất. Cần có nhiều thử nghiệm trên nhiều môi trường và mô hình khác nhau.
◦
Vì kết quả chỉ dành cho một trình mô phỏng và tập dữ liệu cụ thể nên cần phải xác minh để xác định xem chúng có thể được khái quát hóa cho các trình mô phỏng hoặc tập dữ liệu khác hay không.
◦
Có thể thiếu giải thích chi tiết về việc điều chỉnh các tham số của phương pháp Chuyển giao tối ưu (OT).