HPC Digital Twins for Evaluating Scheduling Policies, Incentive Structures and their Impact on Power and Cooling
Created by
Haebom
저자
Matthias Maiterth, Wesley H. Brewer, Jaya S. Kuruvella, Arunavo Dey, Tanzima Z. Islam, Kevin Menear, Dmitry Duplyakin, Rashadul Kabir, Tapasya Patki, Terry Jones, Feiyi Wang
개요
본 논문은 고성능 컴퓨팅(HPC)에서 자원 활용을 최적화하기 위한 스케줄러 평가 방식으로, 기존의 배포 후 분석이나 인프라를 모델링하지 않는 시뮬레이터 방식의 한계를 극복하기 위해 스케줄링과 디지털 트윈을 통합한 새로운 프레임워크를 제시합니다. 이 프레임워크는 배포 전에 매개변수 구성 및 스케줄링 결정이 물리적 자산에 미치는 영향을 이해하기 위한 가정 분석(what-if studies)을 가능하게 합니다. 주요 내용으로는 디지털 트윈 프레임워크에 스케줄링 기능을 확장하고, 공개 데이터셋을 사용하여 다양한 HPC 시스템을 통합하며, 외부 스케줄링 시뮬레이터를 통합하는 확장 기능을 구현하고, 인센티브 구조 및 머신러닝 기반 스케줄링을 평가하는 방법을 제시합니다. 최종적으로는 HPC 시스템의 지속 가능성 및 시뮬레이션된 시스템에 대한 영향을 평가하기 위한 가정 시나리오를 가능하게 합니다.