본 연구는 9개 센터의 12-리드 심전도 기록 120만 건으로 구성된 대규모 벤치마크인 OpenECG를 소개하여 공개 데이터셋으로 훈련된 심전도 기반 모델(ECG-FM)을 평가합니다. ResNet-50과 Vision Transformer 아키텍처를 사용하여 SimCLR, BYOL, MAE 세 가지 자기 지도 학습 방법을 조사하고, leave-one-dataset-out 실험과 데이터 스케일링 분석을 통해 모델의 일반화 성능을 평가합니다. 다양한 데이터셋으로 사전 훈련하는 것이 일반화 성능을 크게 향상시키며, BYOL과 MAE가 SimCLR보다 우수한 성능을 보여 대조 학습보다 특징 일관성 및 생성 학습의 효과를 강조합니다. 데이터 스케일링 실험 결과, BYOL과 MAE는 전체 데이터의 60-70%에서 성능이 포화되는 반면, SimCLR은 더 많은 데이터를 필요로 합니다. 이러한 결과는 공개적으로 이용 가능한 심전도 데이터가 강력한 ECG-FM을 훈련하는 데 있어 독점 데이터셋과 동등하거나 우수할 수 있음을 보여주며, 확장 가능하고 임상적으로 의미 있는 AI 기반 심전도 분석의 길을 열어줍니다.