Este artículo aborda un problema real de optimización combinatoria que involucra múltiples objetivos en conflicto, como el precio, la calidad del producto y la sostenibilidad. Si bien existen métodos computacionalmente eficientes para agregar múltiples objetivos en una única función objetivo (p. ej., una combinación lineal), predefinir los pesos de las combinaciones lineales es un desafío. Como alternativa, los métodos de aprendizaje interactivo que solicitan a los usuarios comparar soluciones candidatas son prometedores. Los desafíos clave son generar rápidamente candidatos, aprender una función objetivo que conduzca a soluciones de alta calidad y minimizar las interacciones del usuario. Este artículo propone un método basado en el marco de Elicitación Constructiva de Preferencias (CPE) que mejora tres atributos: velocidad de interacción, rendimiento de aprendizaje y número de interacciones del usuario. Para mejorar la velocidad de interacción, utilizamos un conjunto de soluciones (relajado). Para optimizar el rendimiento de aprendizaje, empleamos la estimación de máxima verosimilitud del modelo de preferencia de Bradley-Terry. Para reducir el número de interacciones del usuario, empleamos una función de adquisición basada en conjuntos inspirada en el aprendizaje activo. Los experimentos en tareas de configuración de PC y problemas realistas de enrutamiento de múltiples instancias demuestran que nuestro método logra una selección de consultas más rápida, menos consultas y soluciones combinatorias de mayor calidad que los métodos CPE existentes.