Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Planificación de heurísticas: planificación estratégica en modelos de lenguaje grandes con búsqueda de árbol de Monte Carlo para automatizar la optimización heurística

Created by
  • Haebom

Autor

Hui Wang, Xufeng Zhang, Chaoxu Mu

Describir

En este artículo, proponemos un nuevo método para optimizar automáticamente las heurísticas utilizando modelos de lenguaje a gran escala (LLM), denominado Heurística Basada en Planificación (PoH). PoH mejora iterativamente las heurísticas al integrar la función de autorreflexión de los LLM con el algoritmo de Búsqueda de Árbol de Monte Carlo (MCTS). Evalúa el rendimiento de las heurísticas y ofrece sugerencias de mejora, explorando eficazmente las rutas que permiten obtener mayores recompensas. En este trabajo, aplicamos PoH al problema del viajante y al problema de programación de flujo de trabajos, y demostramos que supera a las heurísticas desarrolladas manualmente y a otros métodos de diseño heurístico automático basados ​​en LLM. En particular, alcanza un rendimiento de vanguardia en problemas a gran escala.

Takeaways, Limitations

Takeaways:
Presentamos una nueva posibilidad para diseñar y optimizar automáticamente heurísticas aprovechando LLM.
Puede reducir la dificultad y el consumo de tiempo del diseño heurístico manual existente.
Muestra un rendimiento excelente, especialmente en problemas de optimización combinatoria a gran escala.
PoH tiene una gran aplicabilidad a varios problemas de optimización combinatoria.
Limitations:
Actualmente, sólo se ha aplicado a problemas de vendedores viajeros y problemas de programación de trabajos de flujo, por lo que su generalización a otros tipos de problemas requiere más estudios.
Dado que depende del rendimiento de LLM, las limitaciones de LLM pueden afectar el rendimiento de PoH.
El costo computacional puede ser elevado. Debido a la naturaleza del algoritmo MCTS, es posible que la complejidad computacional sea alta.
👍