Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

HPC Digital Twins for Evaluating Scheduling Policies, Incentive Structures and their Impact on Power and Cooling

Created by
  • Haebom

저자

Matthias Maiterth, Wesley H. Brewer, Jaya S. Kuruvella, Arunavo Dey, Tanzima Z. Islam, Kevin Menear, Dmitry Duplyakin, Rashadul Kabir, Tapasya Patki, Terry Jones, Feiyi Wang

개요

본 논문은 고성능 컴퓨팅(HPC)에서 자원 활용을 최적화하기 위한 스케줄러 평가 방식으로, 기존의 배포 후 분석이나 인프라를 모델링하지 않는 시뮬레이터 방식의 한계를 극복하기 위해 스케줄링과 디지털 트윈을 통합한 새로운 프레임워크를 제시합니다. 이 프레임워크는 배포 전에 매개변수 구성 및 스케줄링 결정이 물리적 자산에 미치는 영향을 이해하기 위한 가정 분석(what-if studies)을 가능하게 합니다. 주요 내용으로는 디지털 트윈 프레임워크에 스케줄링 기능을 확장하고, 공개 데이터셋을 사용하여 다양한 HPC 시스템을 통합하며, 외부 스케줄링 시뮬레이터를 통합하는 확장 기능을 구현하고, 인센티브 구조 및 머신러닝 기반 스케줄링을 평가하는 방법을 제시합니다. 최종적으로는 HPC 시스템의 지속 가능성 및 시뮬레이션된 시스템에 대한 영향을 평가하기 위한 가정 시나리오를 가능하게 합니다.

시사점, 한계점

시사점:
HPC 스케줄러 평가를 위한 새로운 디지털 트윈 기반 메타 프레임워크 제시
배포 전 가정 분석을 통한 스케줄링 전략 및 매개변수 최적화 가능
다양한 HPC 시스템 및 외부 시뮬레이터 통합을 통한 확장성 확보
인센티브 구조 및 머신러닝 기반 스케줄링 평가 가능
HPC 시스템의 지속 가능성 평가 가능
한계점:
제시된 프레임워크의 실제 HPC 환경 적용 및 성능 검증에 대한 추가 연구 필요
디지털 트윈 모델의 정확도 및 신뢰성에 대한 검토 필요
사용된 공개 데이터셋의 한계 및 데이터 편향에 대한 고려 필요
다양한 스케줄링 알고리즘 및 시스템에 대한 일반화 가능성 검토 필요
👍