[공지사항]을 빙자한 안부와 근황 
Show more

दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

कठिनाई-निर्देशित नमूनाकरण के साथ कार्य-विशिष्ट जनरेटिव डेटासेट आसवन

Created by
  • Haebom

लेखक

मिंगझुओ ली, गुआंग ली, जियाफेंग माओ, लिनफेंग ये, ताकाहिरो ओगावा, मिक्की हसेयामा

रूपरेखा

इस पत्र में, हम बड़े डेटासेट पर निर्भरता को कम करने के लिए एक जनरेटिव मॉडल का उपयोग करके एक डेटासेट आसवन तकनीक का प्रस्ताव करते हैं। मूल डेटासेट के साथ संगति पर केंद्रित मौजूदा विधियों के विपरीत, यह पत्र वर्गीकरण कार्यों जैसे विशिष्ट डाउनस्ट्रीम कार्यों के प्रदर्शन को बेहतर बनाने के लिए एक कार्य-विशिष्ट नमूनाकरण रणनीति प्रस्तावित करता है। यह एक ऐसी विधि है जो इमेज पूल से मूल डेटासेट के कठिनाई वितरण से मेल खाने वाला एक नमूना वितरण प्राप्त करके एक डेटासेट उत्पन्न करती है, और वितरण पूर्वाग्रह को ठीक करने के लिए एक पूर्व-प्रसंस्करण चरण के रूप में लॉग रूपांतरण लागू करती है। व्यापक प्रयोगों के माध्यम से, हम प्रस्तावित विधि की प्रभावशीलता की पुष्टि करते हैं और अन्य डाउनस्ट्रीम कार्यों के लिए इसकी प्रयोज्यता का सुझाव देते हैं। कोड GitHub पर उपलब्ध है।

Takeaways, Limitations

Takeaways:
कार्य-विशिष्ट नमूनाकरण रणनीतियों के माध्यम से डाउनस्ट्रीम कार्यों के प्रदर्शन में सुधार की संभावना का सुझाव देता है।
जनरेटिव मॉडल-आधारित डेटासेट आसवन के क्षेत्र में एक नया परिप्रेक्ष्य (कठिनाई को ध्यान में रखते हुए)।
लॉग रूपांतरण के माध्यम से वितरण पूर्वाग्रह को सही करने के प्रभाव की पुष्टि करना।
प्रस्तावित विधि के कोड के प्रकटीकरण के माध्यम से पुनरुत्पादनशीलता और विस्तारशीलता सुनिश्चित करना।
Limitations:
वर्तमान में, हम केवल वर्गीकरण कार्यों पर ध्यान केंद्रित कर रहे हैं। अन्य अनुप्रवाह कार्यों के लिए सामान्यीकरण पर और अध्ययन की आवश्यकता है।
प्रस्तावित कठिनाई मापन विधि की सीमाएँ और सुधार की संभावित गुंजाइश।
यह निर्धारित करने के लिए आगे प्रयोगों की आवश्यकता है कि क्या विशिष्ट डेटासेट और कार्यों के लिए प्रदर्शन सुधार अन्य डेटासेट और कार्यों के लिए सामान्यीकृत होते हैं।
👍