High-Fidelity Synthetic ECG Generation via Mel-Spectrogram Informed Diffusion Training
Created by
Haebom
저자
Zhuoyi Huang, Nutan Sahoo, Anamika Kumari, Girish Kumar, Kexuan Cai, Shixing Cao, Yue Kang, Tian Xia, Somya Chatterjee, Nicholas Hausman, Aidan Jay, Eric S. Rosenthal, Soundar Srinivasan, Sadid Hasan, Alex Fedorov, Sulaiman Vesal
개요
본 논문은 심장 관리를 위한 기계 학습 발전을 저해하는 개인 정보 보호 문제를 해결하기 위해, 환자 맞춤형 생리 신호를 생성할 수 있는 조건부 확산 기반 Structured State Space Model (SSSD-ECG)을 제안한다. 이를 위해 시간-주파수 도메인 감독을 사용하는 MIDT-ECG (Mel-Spectrogram Informed Diffusion Training)와 환자별 맞춤형 합성을 위한 다중 모드 인구 통계학적 조건 지정을 도입했다. PTB-XL 데이터셋을 통해 신호 충실도, 임상적 일관성, 개인 정보 보호 및 다운스트림 작업 유용성을 평가한 결과, MIDT-ECG는 형태학적 일관성을 개선하고 개인 정보 보호를 강화했으며, 환자 맞춤형 합성을 통해 신호 대 잡음비와 개인화 기능을 향상시켰다.
시사점, 한계점
•
시사점:
◦
MIDT-ECG를 통해 생리적 구조적 현실성을 강화하여 형태학적 일관성을 향상시켰다.
◦
다중 모드 인구 통계학적 조건을 활용하여 환자 맞춤형 합성을 구현했다.
◦
개인 정보 보호를 강력하게 유지하며, 기존 방법론 대비 모든 지표에서 4-8% 향상을 보였다.
◦
저데이터 환경에서도 합성 ECG 데이터로 훈련된 분류기가 실제 데이터로 훈련된 분류기와 유사한 성능을 보였다.