Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

HPC Digital Twins for Evaluating Scheduling Policies, Incentive Structures and their Impact on Power and Cooling

Created by
  • Haebom

作者

Matthias Maiterth, Wesley H. Brewer, Jaya S. Kuruvella, Arunavo Dey, Tanzima Z. Islam, Kevin Menear, Dmitry Duplyakin, Rashadul Kabir, Tapasya Patki, Terry Jones, Feiyi Wang

概要

本論文は、高性能コンピューティング(HPC)でリソース活用を最適化するためのスケジューラ評価方法で、既存の展開後の分析やインフラをモデル化しないシミュレータの限界を克服するために、スケジューリングとデジタルツインを統合した最初のフレームワークを提示する。このフレームワークにより、展開前にパラメータ設定とスケジューリング決定が物理資産に与える影響を理解する前提シナリオ分析が可能になり、実際の運用環境で簡単に実装できない変更の見直しも可能です。具体的には、スケジューリング機能を拡張したデジタルツインフレームワークの提供、パブリックデータセットに基づいて多様なトップレベルHPCシステム統合、外部スケジューリングシミュレータ統合拡張実装、インセンティブ構造の実装と評価、機械学習ベースのスケジューリング評価などを行い、HPCシステムの持続可能性とシミュレーションシステムへの影響を評価する仮定シナリオを可能にする。

Takeaways、Limitations

Takeaways:
HPCスケジューラ評価のための新しいパラダイム提示:デジタルツインベースの事前評価可能
さまざまなHPCシステムとスケジューリング技術の統合評価環境を提供
インセンティブ構造と機械学習ベースのスケジューリングの効果的な評価とプロトタイピング
持続可能性とシステムへの影響に対するWhat-if分析
Limitations:
デジタルツインの精度と現実性の検証が必要
利用可能なパブリックデータセットの制限によるシステムカバレッジの制約
複雑なHPCシステムの正確なモデリング困難
提案されたフレームワークのスケーラビリティとメンテナンスに関する追加の研究が必要
👍