Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Evaluación de la eficacia del razonamiento basado en LLM para la programación de tareas multiobjetivo en HPC

Created by
  • Haebom

Autor

Prachi Jadhav, Hongwei Jin, Ewa Deelman, Prasanna Balaprakash

Describir

Este documento propone un planificador basado en un modelo de lenguaje a gran escala (LLM) basado en el marco ReAct para abordar problemas de planificación de tareas de computación de alto rendimiento (HPC). Los métodos heurísticos existentes (FCFS, SJF) y las técnicas de optimización carecen de adaptabilidad a cargas de trabajo dinámicas y no pueden optimizar simultáneamente múltiples objetivos. El planificador basado en LLM propuesto utiliza memoria scratchpad para rastrear el historial de planificación, mejora la toma de decisiones mediante retroalimentación en lenguaje natural y garantiza la viabilidad y la seguridad mediante un módulo de aplicación de restricciones. Las evaluaciones en varios escenarios de carga de trabajo de HPC del mundo real utilizando O4-Mini de OpenAI y Claude 3.7 de Anthropic demuestran que el planificador basado en LLM equilibra eficazmente múltiples objetivos y proporciona inferencia transparente mediante el seguimiento del lenguaje natural. Exhibe una excelente satisfacción de las restricciones y se adapta a diversas cargas de trabajo sin aprendizaje específico del dominio. Sin embargo, el equilibrio entre la calidad de la inferencia y la sobrecarga computacional sigue siendo un desafío para la implementación en tiempo real. Este artículo es el primer estudio exhaustivo de la aplicación del LLM inferencial a la programación de HPC, y demuestra su potencial para la optimización de múltiples objetivos al tiempo que destaca las limitaciones de la eficiencia computacional.

Takeaways, Limitations

Takeaways:
Demostramos que la programación basada en LLM puede equilibrar eficazmente múltiples objetivos (minimizar el tiempo de ejecución, reducir la latencia, optimizar la utilización de recursos y garantizar la equidad) en diversas cargas de trabajo de HPC.
El seguimiento del lenguaje natural puede ayudar a garantizar la transparencia en el proceso de programación y hacer que la toma de decisiones sea más fácil de entender.
Proporciona la flexibilidad de adaptarse a diversas cargas de trabajo sin aprendizaje específico del dominio.
Presentamos la aplicación potencial de LLM a problemas de programación complejos.
Limitations:
El equilibrio entre la calidad de inferencia de LLM y la sobrecarga computacional puede dificultar la implementación en tiempo real.
El costo computacional de LLM es significativo, lo que requiere una revisión de la eficiencia económica para su aplicación en entornos HPC reales.
👍