Bài báo này đề xuất một phương pháp học tăng cường phân biệt tập hợp đa mục tiêu sử dụng các hành động tham số hỗn hợp để giải quyết vấn đề tương thích đa mục tiêu trong lái xe tự động. Các phương pháp học tăng cường hiện tại gặp khó khăn trong việc đạt được khả năng tương thích đa mục tiêu trong các tình huống lái xe phức tạp do mạng lưới đánh giá đơn lẻ và cấu trúc không gian hành động loại đơn của chúng. Phương pháp được đề xuất giải quyết những thách thức này bằng cách sử dụng phương pháp phân biệt tập hợp tập trung vào các mục tiêu khác nhau thông qua các hàm phần thưởng độc lập. Hơn nữa, bằng cách kết hợp các cấu trúc không gian hành động tham số hỗn hợp, nó tạo ra các hành vi lái xe bao gồm cả hướng dẫn trừu tượng và các lệnh điều khiển cụ thể. Cuối cùng, nó phát triển một cơ chế tìm kiếm dựa trên sự không chắc chắn hỗ trợ các hành động hỗn hợp để tăng tốc quá trình học các chính sách tương thích đa mục tiêu. Kết quả thử nghiệm trong các tình huống đường cao tốc nhiều làn, cả dựa trên mô phỏng và trên tập dữ liệu HighD, chứng minh rằng phương pháp được đề xuất học lái xe tự động tương thích đa mục tiêu một cách hiệu quả về mặt hiệu suất, tính nhất quán về hành vi và an toàn.