Este artículo propone un método de aprendizaje por refuerzo de discriminación por conjuntos multiobjetivo que utiliza acciones con parámetros mixtos para abordar el problema de compatibilidad multiobjetivo en la conducción autónoma. Los métodos de aprendizaje por refuerzo existentes tienen dificultades para lograr la compatibilidad multiobjetivo en escenarios de conducción complejos debido a su red de valoración única y su estructura de espacio de acción de tipo único. El método propuesto aborda estos desafíos utilizando un método de discriminación por conjuntos que se centra en diferentes objetivos a través de funciones de recompensa independientes. Además, al incorporar estructuras de espacio de acción con parámetros mixtos, genera comportamientos de conducción que abarcan tanto la guía abstracta como los comandos de control concretos. Finalmente, desarrolla un mecanismo de búsqueda basado en la incertidumbre que admite acciones mixtas para acelerar el aprendizaje de políticas compatibles con múltiples objetivos. Los resultados experimentales en escenarios de carreteras de varios carriles, tanto basados en simuladores como en el conjunto de datos HighD, demuestran que el método propuesto aprende eficientemente la conducción autónoma compatible con múltiples objetivos en términos de eficiencia, consistencia del comportamiento y seguridad.