इस पत्र में, हम बड़े डेटासेट पर निर्भरता को कम करने के लिए एक जनरेटिव मॉडल का उपयोग करके एक डेटासेट आसवन तकनीक का प्रस्ताव करते हैं। मूल डेटासेट के साथ संगति पर केंद्रित मौजूदा विधियों के विपरीत, यह पत्र वर्गीकरण कार्यों जैसे विशिष्ट डाउनस्ट्रीम कार्यों के प्रदर्शन को बेहतर बनाने के लिए एक कार्य-विशिष्ट नमूनाकरण रणनीति प्रस्तावित करता है। यह एक ऐसी विधि है जो इमेज पूल से मूल डेटासेट के कठिनाई वितरण से मेल खाने वाला एक नमूना वितरण प्राप्त करके एक डेटासेट उत्पन्न करती है, और वितरण पूर्वाग्रह को ठीक करने के लिए एक पूर्व-प्रसंस्करण चरण के रूप में लॉग रूपांतरण लागू करती है। व्यापक प्रयोगों के माध्यम से, हम प्रस्तावित विधि की प्रभावशीलता की पुष्टि करते हैं और अन्य डाउनस्ट्रीम कार्यों के लिए इसकी प्रयोज्यता का सुझाव देते हैं। कोड GitHub पर उपलब्ध है।