VeritasEst는 GPU 클러스터에서 딥러닝 모델 학습 시 발생하는 Out-Of-Memory (OOM) 에러를 예방하기 위한 CPU 기반 메모리 예측 도구입니다. 기존의 정적 그래프 분석이나 GPU 기반 프로파일링 방식과 달리, VeritasEst는 GPU에 접근하지 않고도 학습에 필요한 최대 GPU 메모리를 정확하게 예측합니다. 이는 작업 스케줄링 전에 정확한 메모리 정보를 제공하여 OOM을 효과적으로 방지하고 GPU 할당을 최적화하는 데 기여합니다. 수천 번의 CNN 모델 실험 결과, 기존 방법 대비 상대 오차를 84%, 예측 실패 확률을 73% 감소시키는 성능을 보였습니다.