Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

HPC Digital Twins for Evaluating Scheduling Policies, Incentive Structures and their Impact on Power and Cooling

Created by
  • Haebom

作者

Matthias Maiterth, Wesley H. Brewer, Jaya S. Kuruvella, Arunavo Dey, Tanzima Z. Islam, Kevin Menear, Dmitry Duplyakin, Rashadul Kabir, Tapasya Patki, Terry Jones, Feiyi Wang

概要

本論文は、高性能コンピューティング(HPC)でリソース利用を最適化するためのスケジューラ評価方式で、既存の展開後の分析やインフラをモデル化しないシミュレータ方式の限界を克服するために、スケジューリングとデジタルツインを統合した新しいフレームワークを提示します。このフレームワークは、展開前のパラメータ設定とスケジューリング決定が物理資産に与える影響を理解するための前提分析を可能にします。主な内容は、デジタルツインフレームワークにスケジューリング機能を拡張し、パブリックデータセットを使用してさまざまなHPCシステムを統合し、外部スケジューリングシミュレータを統合する拡張機能を実装し、インセンティブ構造と機械学習ベースのスケジューリングを評価する方法を示しています。最後に、HPCシステムの持続可能性とシミュレートされたシステムへの影響を評価するための前提シナリオを可能にします。

Takeaways、Limitations

Takeaways:
HPCスケジューラ評価のための新しいデジタルツインベースのメタフレームワークの提示
展開前の前提分析によるスケジューリング戦略とパラメータの最適化
さまざまなHPCシステムと外部シミュレータ統合によるスケーラビリティの確保
インセンティブ構造と機械学習ベースのスケジューリング評価可能
HPCシステムのサステナビリティ評価可能
Limitations:
提示されたフレームワークの実際のHPC環境の適用と性能検証に関するさらなる研究が必要
デジタルツインモデルの精度と信頼性のレビューが必要
使用されるパブリックデータセットの制限とデータ偏向の考慮が必要
さまざまなスケジューリングアルゴリズムとシステムの一般化可能性レビューが必要
👍