Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

OR-LLM-Agent: Automatización del modelado y la resolución de problemas de optimización de investigación de operaciones con razonamiento LLM

Created by
  • Haebom

Autor

Bowen Zhang, Pengcheng Luo

Describir

En este artículo, presentamos OR-LLM-Agent, un enfoque novedoso para aplicar modelos de lenguaje a gran escala (LLM) a la resolución de problemas de investigación operativa (IO). A diferencia de los métodos existentes que se basan en ingeniería rápida o estrategias de ajuste fino, OR-LLM-Agent descompone el problema en tres etapas: modelado matemático, generación de código y depuración basada en LLM con capacidades de inferencia. Cada etapa es gestionada por un subagente especializado, lo que permite una inferencia más efectiva. Además, señalamos las limitaciones de los benchmarks existentes como NL4OPT, MAMO e IndustryOR, y construimos un conjunto de datos de alta calidad, BWOR, para una evaluación más confiable del rendimiento de los LLM. Los resultados experimentales muestran que OR-LLM-Agent supera a los métodos de vanguardia existentes como GPT-o3, Gemini 2.5 Pro y ORLM en al menos un 7% en términos de precisión. Esto demuestra la efectividad de la descomposición de tareas para resolver problemas de IO.

Takeaways, Limitations

Takeaways:
Presentando un nuevo paradigma para la resolución de problemas de IO utilizando LLM basado en inferencia
Mejorar la capacidad de resolución de problemas de OI eficientemente en LLM mediante la descomposición de tareas
Presentamos un nuevo conjunto de datos de alta calidad, BWOR, que supera las limitaciones de los puntos de referencia existentes
Demostración de la eficacia de la estrategia de descomposición de tareas mediante el rendimiento superior de OR-LLM-Agent
Limitations:
Se necesita más investigación sobre la generalidad y escalabilidad del conjunto de datos BWOR.
Aumento potencial del coste computacional debido a la complejidad del OR-LLM-Agent
Necesidad de verificar el rendimiento de generalización para varios tipos de problemas OR
Se necesitan investigaciones y verificaciones adicionales para aplicaciones industriales prácticas.
👍