यह शोधपत्र बड़े पैमाने के डीप लर्निंग मॉडलों के प्रशिक्षण हेतु आवश्यक विशाल डेटासेट से जुड़ी उच्च लागतों को कम करने के लिए एक स्व-पर्यवेक्षित डेटासेट आसवन (DSD) तकनीक का प्रस्ताव करता है। पारंपरिक पर्यवेक्षित डेटासेट आसवन के विपरीत, हम स्व-पर्यवेक्षित शिक्षण द्वारा प्राप्त छवियों और अभ्यावेदनों को एक आसुत डेटासेट में संपीड़ित करने की एक विधि प्रस्तुत करते हैं। इसे प्राप्त करने के लिए, हम निम्न-आयामी आधारों का उपयोग करके छवियों और अभ्यावेदनों को पैरामीटराइज़ करने की एक नवीन विधि, डेटा संवर्द्धन अस्थिरता को दूर करने के लिए एक पूर्व-निर्धारित संवर्द्धन तकनीक, और आसवन युग्मों को संपीड़ित करने के लिए एक हल्का नेटवर्क प्रस्तावित करते हैं। विभिन्न डेटासेट पर किए गए प्रयोग प्रस्तावित विधि की प्रभावशीलता, विभिन्न आर्किटेक्चर में इसके सामान्यीकरण प्रदर्शन और इसके उत्कृष्ट स्थानांतरण अधिगम प्रदर्शन को प्रदर्शित करते हैं।