Signal, Image, or Symbolic: Exploring the Best Input Representation for Electrocardiogram-Language Models Through a Unified Framework
Created by
Haebom
저자
William Han, Chaojing Duan, Zhepeng Cen, Yihang Yao, Xiaoyu Song, Atharva Mhaskar, Dylan Leong, Michael A. Rosenberg, Emerson Liu, Ding Zhao
개요
본 논문은 심전도(ECG) 해석에 대규모 언어 모델(LLM)을 적용한 심전도-언어 모델(ELM)에서 가장 효과적인 ECG 입력 표현 방식을 조사한 연구입니다. 기존의 분류 기반 시스템과 달리 ELM은 전문 심장 전기 생리학자처럼 진단을 내리고, 파형 형태를 분석하고, 기여 요인을 식별하고, 환자별 행동 계획을 제안합니다. 연구에서는 원시 시계열 신호, 렌더링된 이미지, 이산화된 기호 시퀀스 세 가지 ECG 입력 표현 방식을 6개의 공개 데이터셋과 5개의 평가 지표를 사용하여 종합적으로 비교 평가했습니다.
시사점, 한계점
•
시사점: 기호 표현 방식이 신호 및 이미지 입력 방식보다 통계적으로 유의미한 성능 향상을 보여 ELM 개발 시 입력 표현 방식 선택에 대한 명확한 지침을 제공합니다. LLM 백본, ECG 지속 시간, 토큰 수 예산의 영향 및 신호 섭동에 대한 강건성 평가를 통해 ELM 개발에 중요한 정보를 제공합니다.
•
한계점: 본 연구는 특정한 6개의 공개 데이터셋과 5개의 평가 지표에 국한되어 있으며, 다른 데이터셋이나 평가 지표에서는 결과가 달라질 수 있습니다. 또한, 실제 임상 환경에서의 ELM 성능에 대한 검증은 추가 연구가 필요합니다.