सीमित लेबल वाले आँकड़ों और सूक्ष्म किन्तु चिकित्सकीय रूप से प्रासंगिक लय और रूपात्मक परिवर्तनों को पकड़ने की चुनौती के कारण इलेक्ट्रोकार्डियोग्राम (ईसीजी) निदान चुनौतीपूर्ण बना हुआ है। इस शोधपत्र में, हम कॉन्ट्रास्टिव रेगुलराइज़्ड मास्क्ड ऑटोएनकोडर (CREMA) प्रस्तुत करते हैं, जो 12-लीड ईसीजी के लिए एक आधारभूत मॉडल है जिसे स्व-पर्यवेक्षित पूर्व-प्रशिक्षण के माध्यम से सामान्यीकरण योग्य निरूपण सीखने के लिए डिज़ाइन किया गया है। CREMA, कॉन्ट्रास्टिव रेगुलराइज़्ड मास्क्ड ऑटोएनकोडर (MAE) हानि के माध्यम से जनरेटिव लर्निंग को कॉन्ट्रास्टिव रेगुलराइज़ेशन के साथ जोड़ता है और स्थानीय तरंगरूप विवरण और वैश्विक कालिक निर्भरताओं, दोनों को पकड़ने के लिए सिग्नल ट्रांसफ़ॉर्मर (SiT) आर्किटेक्चर का उपयोग करता है। हम बेंचमार्क डेटासेट और वास्तविक-विश्व नैदानिक सेटिंग्स पर CREMA का मूल्यांकन करते हैं, जिसमें महत्वपूर्ण वितरणात्मक बदलाव वाले परिनियोजन परिदृश्य भी शामिल हैं। CREMA, रैखिक जाँच और फ़ाइन-ट्यूनिंग मूल्यांकनों में पर्यवेक्षित शिक्षण आधारभूत मॉडल और मौजूदा स्व-पर्यवेक्षित शिक्षण मॉडल, दोनों से बेहतर प्रदर्शन करता है। वास्तविक-विश्व सेटिंग्स में इसकी मज़बूती विविध नैदानिक क्षेत्रों, विशेष रूप से आपातकालीन देखभाल में, इसके बेहतर प्रदर्शन से प्रदर्शित होती है। ये परिणाम दर्शाते हैं कि CREMA ईसीजी निदान के लिए एक मापनीय और मजबूत आधारभूत मॉडल के रूप में कार्य करता है, जो विषम और उच्च जोखिम वाले नैदानिक सेटिंग्स में डाउनस्ट्रीम अनुप्रयोगों का समर्थन करता है।