दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

भाषा का उपयोग करके छवियों में अर्थपूर्ण वृद्धि

Created by
  • Haebom

लेखक

साहिती येरामिलि, जयंत श्रवण ताम्रपल्ली, तन्मय गिरीश कुलकर्णी, जोनाथन फ्रांसिस, एरिक न्यबर्ग

रूपरेखा

डीप लर्निंग मॉडल्स की ओवरफिटिंग समस्या के समाधान के लिए, यह शोधपत्र एक प्रसार मॉडल का उपयोग करते हुए एक डेटा संवर्द्धन तकनीक प्रस्तावित करता है जो पाठ के आधार पर यथार्थवादी चित्र उत्पन्न करती है। प्रसार मॉडल को प्रशिक्षित करने के लिए उपयोग किए गए विशाल डेटासेट के साथ मौजूदा डेटासेट को संवर्धित करके, हम डीप लर्निंग मॉडल्स के आउट-ऑफ-डोमेन सामान्यीकरण प्रदर्शन को बेहतर बनाने के लिए विभिन्न रणनीतियों का पता लगाते हैं।

Takeaways, Limitations

Takeaways:
हम प्रदर्शित करते हैं कि प्रसार मॉडल का उपयोग करने वाली डेटा संवर्द्धन तकनीकें गहन शिक्षण मॉडल की ओवरफिटिंग समस्या को कम कर सकती हैं और वास्तविक दुनिया के वातावरण में सामान्यीकरण प्रदर्शन में सुधार कर सकती हैं।
यह मौजूदा डेटासेट के आकार संबंधी बाधाओं को दूर करने तथा डेटा संग्रहण और लेबलिंग की लागत को कम करने की क्षमता प्रदान करता है।
विभिन्न डेटा संवर्द्धन रणनीतियों की तुलना और विश्लेषण करके, हम प्रभावी संवर्द्धन विधियों का सुझाव दे सकते हैं।
Limitations:
प्रस्तावित डेटा संवर्द्धन तकनीक का प्रदर्शन प्रसार मॉडल की छवि निर्माण गुणवत्ता पर निर्भर हो सकता है।
यदि उत्पन्न छवियों की गुणवत्ता कम है, तो यह वास्तव में मॉडल के प्रदर्शन को ख़राब कर सकती है।
यह एक डोमेन-विशिष्ट डेटा संवर्द्धन रणनीति हो सकती है, और कई डोमेन में सामान्यीकरण प्रदर्शन मूल्यांकन की आवश्यकता होती है।
प्रसार मॉडल के विन्यास और हाइपरपैरामीटर अनुकूलन के विस्तृत स्पष्टीकरण का अभाव हो सकता है।
👍