दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

ऑर्थोगोनल बाधाओं के साथ मॉड्यूलर डेल्टा विलय: निरंतर और प्रतिवर्ती मॉडल संरचना के लिए एक स्केलेबल फ्रेमवर्क

Created by
  • Haebom

लेखक

हारिस खान, सादिया आसिफ, शुमैला आसिफ

रूपरेखा

वास्तविक दुनिया में मशीन लर्निंग के परिनियोजन में, मॉडलों को आवश्यकतानुसार निरंतर अद्यतन, निर्मित और चुनिंदा रूप से त्यागना आवश्यक होता है। हालाँकि, मौजूदा मॉडल विलय और निरंतर सीखने के तरीके अक्सर कार्य हस्तक्षेप, भयावह विस्मृति, या प्रतिवर्तीता की कमी से ग्रस्त होते हैं। इस पत्र में, हम ऑर्थोगोनली कंस्ट्रेन्ड मॉड्यूलर डेल्टा मर्जिंग (MDM-OC) का प्रस्ताव करते हैं, जो एक नया ढाँचा है जो परिष्कृत मॉडलों के मापनीय, हस्तक्षेप-मुक्त और प्रतिवर्ती निर्माण को सक्षम बनाता है। प्रत्येक कार्य-विशिष्ट मॉडल को एक साझा आधार से डेल्टा के रूप में एन्कोड किया जाता है और टकरावों को दूर करने के लिए एक ऑर्थोगोनल उप-स्थान में प्रक्षेपित किया जाता है। इन प्रक्षेपित डेल्टाओं को फिर ग्रेडिएंट-आधारित अनुकूलन के माध्यम से विलय करके एक एकीकृत मॉडल बनाया जाता है जो सभी कार्यों में प्रदर्शन बनाए रखता है। यह दृष्टिकोण नए मॉडलों के निरंतर एकीकरण, GDPR आवश्यकताओं जैसे नियमों के अनुपालन के लिए संरचनात्मक पृथक्करण, और लचीले भार विलय और सिंथेटिक पुनर्जनन के माध्यम से मॉडल स्थिरता का समर्थन करता है। विज़न और प्राकृतिक भाषा प्रसंस्करण मानकों पर व्यापक प्रयोगों से पता चलता है कि एमडीएम-ओसी सटीकता, स्थानांतरणीयता और पृथक्करण निष्ठा में पिछले बेसलाइन से बेहतर प्रदर्शन करता है, जबकि यह स्मृति-कुशल और गणना-योग्य बना रहता है। यह ढाँचा मॉड्यूलर और अनुपालक एआई सिस्टम डिज़ाइन करने के लिए एक सैद्धांतिक समाधान प्रदान करता है।

Takeaways, Limitations

Takeaways:
एक स्केलेबल, गैर-हस्तक्षेपकारी और प्रतिवर्ती फाइन-ट्यूनिंग मॉडल निर्माण ढांचा प्रदान करता है।
GDPR जैसे विनियमों का अनुपालन करने के लिए संरचनात्मक मॉडल पृथक्करण का समर्थन
लोचदार भार एकीकरण और सिंथेटिक रीप्ले के माध्यम से मॉडल स्थिरता में सुधार करना।
दृष्टि और प्राकृतिक भाषा प्रसंस्करण कार्यों (सटीकता, व्युत्क्रम, पृथक्करण निष्ठा) में मौजूदा विधियों से बेहतर प्रदर्शन करता है
मेमोरी कुशल और कम्प्यूटेशनल रूप से आसान
Limitations:
इस शोधपत्र में विशिष्ट Limitations का स्पष्ट रूप से उल्लेख नहीं किया गया है। सामान्यीकरण प्रदर्शन को और अधिक सत्यापित करने के लिए विभिन्न डेटासेट पर और प्रयोग और अनुप्रयोग आवश्यक हैं। आगे के शोध से विशिष्ट हार्डवेयर वातावरण पर निर्भरता और मापनीयता की सीमाओं जैसे मुद्दे सामने आ सकते हैं।
👍