Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Obtención de preferencias para optimización combinatoria multiobjetivo con aprendizaje activo y estimación de máxima verosimilitud

Created by
  • Haebom

Autor

Marianne Defresne, Jayanta Mandi, Tías Guns

Describir

Este artículo aborda un problema real de optimización combinatoria que involucra múltiples objetivos en conflicto, como el precio, la calidad del producto y la sostenibilidad. Si bien existen métodos computacionalmente eficientes para agregar múltiples objetivos en una única función objetivo (p. ej., una combinación lineal), predefinir los pesos de las combinaciones lineales es un desafío. Como alternativa, los métodos de aprendizaje interactivo que solicitan a los usuarios comparar soluciones candidatas son prometedores. Los desafíos clave son generar rápidamente candidatos, aprender una función objetivo que conduzca a soluciones de alta calidad y minimizar las interacciones del usuario. Este artículo propone un método basado en el marco de Elicitación Constructiva de Preferencias (CPE) que mejora tres atributos: velocidad de interacción, rendimiento de aprendizaje y número de interacciones del usuario. Para mejorar la velocidad de interacción, utilizamos un conjunto de soluciones (relajado). Para optimizar el rendimiento de aprendizaje, empleamos la estimación de máxima verosimilitud del modelo de preferencia de Bradley-Terry. Para reducir el número de interacciones del usuario, empleamos una función de adquisición basada en conjuntos inspirada en el aprendizaje activo. Los experimentos en tareas de configuración de PC y problemas realistas de enrutamiento de múltiples instancias demuestran que nuestro método logra una selección de consultas más rápida, menos consultas y soluciones combinatorias de mayor calidad que los métodos CPE existentes.

Takeaways, Limitations

Takeaways:
Se presenta un método de aprendizaje interactivo eficiente para problemas de optimización combinatoria multiobjetivo.
Se mejoró la velocidad de interacción, el rendimiento del aprendizaje y la cantidad de interacciones del usuario en el marco CPE.
Se demostró un rendimiento superior al de los métodos existentes en problemas del mundo real (configuración de PC, enrutamiento de múltiples instancias).
Uso efectivo del modelo Bradley-Terry y funciones de adquisición basadas en conjuntos.
Limitations:
Se necesita más investigación sobre el rendimiento de generalización del método propuesto.
La verificación de aplicabilidad es necesaria para varios tipos de problemas de optimización combinatoria.
Dependencia de la precisión del modelo de preferencia del usuario.
Se requiere una revisión de escalabilidad para problemas de gran escala.
👍