दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

सीसीडी: आजीवन जनरेटिव मॉडलिंग के लिए निरंतर संगति प्रसार

Created by
  • Haebom

लेखक

जिंगरेन लियू, शूनिंग जू, यूं वांग, झोंग जी, जियानग्यू चेन

रूपरेखा

यह शोधपत्र सतत प्रसार सृजन (CDG) प्रस्तुत करता है, जो सतत अधिगम (CL) परिवेशों में प्रसार-आधारित मॉडलों की जनरेटिव कैटास्ट्रॉफिक फॉरगेटिंग (GCF) समस्या के समाधान हेतु एक नवीन ढाँचा है। पूर्व अध्ययनों के विपरीत, जो अनुमान-आधारित दृष्टिकोणों या अनुपयुक्त रीप्ले जनरेटरों पर निर्भर करते हैं, CDG, CL परिवेशों में प्रसार मॉडलों के कार्यान्वयन के तरीके को पुनर्परिभाषित करता है और एक संरचित पाइपलाइन प्रदान करता है जो GCF न्यूनीकरण के व्यवस्थित मूल्यांकन को सक्षम बनाता है। इसके अतिरिक्त, हम प्रसार मॉडलों की अद्वितीय जनरेटिव गतिशीलता के क्रॉस-टास्क विश्लेषण पर आधारित CDG के लिए पहला सैद्धांतिक आधार प्रस्तुत करते हैं और ज्ञान संरक्षण के लिए तीन संगति सिद्धांतों की पहचान करते हैं: क्रॉस-टास्क ज्ञान संगति, बिना शर्त ज्ञान संगति, और पूर्व ज्ञान संगति। इन अंतर्दृष्टियों के आधार पर, हम एक सतत संगति प्रसार (CCD) प्रशिक्षण ढाँचा प्रस्तावित करते हैं जो एक पदानुक्रमित हानि फलन के माध्यम से इन तीन संगति उद्देश्यों को लागू करता है। प्रायोगिक परिणाम दर्शाते हैं कि सीसीडी विभिन्न बेंचमार्कों पर अत्याधुनिक प्रदर्शन प्राप्त करता है, तथा क्रॉस-टास्क ओवरलैप वाले परिदृश्यों में उत्पादन मेट्रिक्स में महत्वपूर्ण सुधार करता है।

____T431_____, ____T432_____

Takeaways:
सतत सीखने के माहौल में प्रसार मॉडल की उत्पादक विस्मरण समस्या का एक व्यवस्थित समाधान।
प्रसार मॉडल में सतत सीखने के लिए पहला सैद्धांतिक आधार प्रदान करता है।
स्थिरता के तीन महत्वपूर्ण सिद्धांत प्रस्तुत करता है: कार्यों में ज्ञान स्थिरता, बिना शर्त ज्ञान स्थिरता, और पूर्व ज्ञान स्थिरता।
प्रस्तावित सीसीडी ढांचा विभिन्न मानदंडों पर अत्याधुनिक प्रदर्शन प्राप्त करता है।
बेहतर प्रदर्शन, विशेष रूप से कार्यों के बीच ओवरलैप वाले परिदृश्यों में।
Limitations:
प्रस्तावित सैद्धांतिक आधार और ढांचे की व्यापकता का और अधिक सत्यापन आवश्यक है।
अधिक विविध और जटिल सतत शिक्षण परिदृश्यों का प्रायोगिक मूल्यांकन आवश्यक है।
कम्प्यूटेशनल लागत और प्रशिक्षण समय के विश्लेषण का अभाव
👍