Sign In

OpenECG: Benchmarking ECG Foundation Models with Public 1.2 Million Records

Created by
  • Haebom
Category
Empty

저자

Zhijiang Wan, Qianhao Yu, Jia Mao, Wenfeng Duan, Cheng Ding

개요

본 연구는 9개 센터의 12-리드 심전도 기록 120만 건으로 구성된 대규모 벤치마크인 OpenECG를 소개하여 공개 데이터셋으로 훈련된 심전도 기반 모델(ECG-FM)을 평가합니다. ResNet-50과 Vision Transformer 아키텍처를 사용하여 SimCLR, BYOL, MAE 세 가지 자기 지도 학습 방법을 조사하고, leave-one-dataset-out 실험과 데이터 스케일링 분석을 통해 모델의 일반화 성능을 평가합니다. 다양한 데이터셋으로 사전 훈련하는 것이 일반화 성능을 크게 향상시키며, BYOL과 MAE가 SimCLR보다 우수한 성능을 보여 대조 학습보다 특징 일관성 및 생성 학습의 효과를 강조합니다. 데이터 스케일링 실험 결과, BYOL과 MAE는 전체 데이터의 60-70%에서 성능이 포화되는 반면, SimCLR은 더 많은 데이터를 필요로 합니다. 이러한 결과는 공개적으로 이용 가능한 심전도 데이터가 강력한 ECG-FM을 훈련하는 데 있어 독점 데이터셋과 동등하거나 우수할 수 있음을 보여주며, 확장 가능하고 임상적으로 의미 있는 AI 기반 심전도 분석의 길을 열어줍니다.

시사점, 한계점

시사점:
공개 데이터셋을 활용한 ECG-FM 훈련의 가능성을 제시합니다.
BYOL과 MAE와 같은 특징 일관성 및 생성 학습 방법의 효과를 보여줍니다.
데이터 스케일링 분석을 통해 최적의 훈련 데이터 크기를 제시합니다.
임상적으로 의미 있는 AI 기반 심전도 분석에 기여할 수 있습니다.
한계점:
OpenECG 데이터셋의 다양성 및 대표성에 대한 추가적인 검토가 필요할 수 있습니다.
특정 아키텍처와 자기 지도 학습 방법에 국한된 연구 결과입니다.
실제 임상 환경에서의 성능 평가가 추가적으로 필요합니다.
다른 자기지도학습 방법이나 아키텍처에 대한 추가적인 연구가 필요합니다.
👍