본 논문은 심전도(ECG) 분류를 위한 새로운 다중 입도 하이브리드 모델인 Cardioformer를 제안합니다. Cardioformer는 크로스 채널 패칭, 계층적 잔차 학습, 그리고 2단계 자기 주의 메커니즘을 통합하여 국소 형태학적 세부 정보와 장기간의 시간적 의존성을 동시에 포착하는 문제를 해결합니다. 다중 스케일 토큰 임베딩을 통해 미세한 국소 특징과 전역 문맥 정보를 인코딩하고, 그 후, 내부 및 외부 입도 자기 주의를 통해 이러한 표현을 선택적으로 융합합니다. 세 개의 벤치마크 ECG 데이터셋에 대한 광범위한 평가 결과, Cardioformer는 기존 최첨단 모델들보다 성능이 우수함을 보여줍니다. MIMIC-IV, PTB-XL, PTB 데이터셋에서 각각 96.34±0.11, 89.99±0.12, 95.59±1.66의 AUROC를 달성했습니다. 또한, MIMIC-IV에서 학습하여 PTB 및 PTB-XL 데이터셋에서 각각 49.18%, 68.41%의 AUROC를 달성하며 강력한 교차 데이터셋 일반화 성능을 보여줍니다. 소스 코드는 https://github.com/KMobin555/Cardioformer 에서 공개됩니다.