心電図(ECG)診断は、限られたラベルデータと微妙ですが、臨床的に意味のあるリズムとフォームの変化を捉える必要があるため、依然として困難な課題です。本論文では、自己指導学習の前訓練を通じて一般化可能な表現を学習するように設計された12リードECGのための基礎モデルであるCREMA(Contrastive Regularized Masked Autoencoder)を提示します。 CREMAは、Contrastive Regularized MAE損失を介して生成学習と対照正規化を組み合わせ、ローカル波形の詳細とグローバルな時間依存性の両方をキャプチャするためにSignal Transformer(SiT)アーキテクチャを使用します。ベンチマークデータセットと実際の臨床環境(分布の激しい展開シナリオを含む)でCREMAを評価しました。 CREMAは、線形プロービングおよび微調整評価で、地図学習基準モデルと既存の自己地図学習モデルを上回ります。特に、緊急治療などの様々な臨床分野で優れた性能を維持し、実際の環境での強力さを実証しています。これらの結果は、CREMAが異種でリスクの高い臨床環境で下流アプリケーションをサポートするスケーラブルで信頼性の高いECG診断基礎モデルとして機能することを示しています。