Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Evaluating the Efficacy of LLM-Based Reasoning for Multiobjective HPC Job Scheduling

Created by
  • Haebom

作者

Prachi Jadhav, Hongwei Jin, Ewa Deelman, Prasanna Balaprakash

概要

本稿では、高性能コンピューティング(HPC)タスクスケジューリングの問題を解決するために、ReActフレームワークに基づく大規模言語モデル(LLM)ベースのスケジューラを提案します。従来のヒューリスティックベースの方法(FCFS、SJF)や最適化技術には、動的なワークロードへの適応力が不足しており、複数の目標を同時に最適化できないという制限があります。提案されたLLMベースのスケジューラは、スクラッチパッドメモリを使用してスケジューリング履歴を追跡し、自然言語フィードバックを使用して意思決定を改善し、制約適用モジュールを介して実行可能性と安全性を保証します。 OpenAI の O4-Mini と Anthropic の Claude 3.7 を使用して、さまざまな実際の HPC ワークロードシナリオで評価した結果、LLM ベースのスケジューリングは、複数の目標のバランスを効果的に調整し、自然言語追跡による透明な推論を提供することを確認しました。制約の満足度に優れ、ドメインに特化した学習なしでさまざまなワークロードに適応します。ただし、推論品質と計算オーバーヘッドとの間のトレードオフは、リアルタイム展開の課題として残ります。本論文は,推論能力を持つLLMをHPCスケジューリングに適用した最初の包括的な研究で,多目的最適化の可能性を示すとともに,計算効率の限界を強調する。

Takeaways、Limitations

Takeaways:
LLMベースのスケジューリングは、さまざまなHPCワークロードで複数の目標(makespanの最小化、待ち時間の削減、リソース使用率の最適化、公平性の保証)を効果的にバランスよく処理できることを示しています。
自然言語追跡により、スケジューリングプロセスの透明性を確保し、意思決定プロセスを理解しやすくすることができます。
ドメインに特化した学習なしでさまざまなワークロードに適応できる柔軟性を提供します。
複雑なスケジューリング問題に対するLLMの利用可能性を提示します。
Limitations:
LLMの推論品質と計算オーバーヘッドの間のトレードオフにより、リアルタイム展開には困難がある可能性があります。
LLMの計算コストが相当であり、実際のHPC環境適用の経済的効率性の検討が必要である。
👍