दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

मोर्स: प्रसार मॉडल के हानि रहित त्वरण के लिए दोहरी-नमूनाकरण

Created by
  • Haebom

लेखक

चाओ ली, जियावेई फैन, अनबांग याओ

रूपरेखा

इस शोधपत्र में, हम मोर्स प्रस्तुत करते हैं, जो एक सरल दोहरे-नमूनाकरण ढाँचा है जो बिना किसी नुकसान के प्रसार मॉडल की गति में सुधार करता है। मोर्स तेज़ जंप सैंपलिंग और एक अनुकूली अवशिष्ट प्रतिक्रिया रणनीति का उपयोग करके पुनरावृत्त निर्माण प्रक्रिया (शोर से डेटा तक) का पुनर्निर्माण करता है। दो मॉडल, डैश और डॉट, परस्पर क्रिया करते हैं। डैश मॉडल एक मौजूदा पूर्व-प्रशिक्षित प्रसार मॉडल है जो बेहतर नमूनाकरण दक्षता के लिए स्थान सुरक्षित करने के लिए जंप-सैंपलिंग तरीके से संचालित होता है। डॉट मॉडल डैश मॉडल की तुलना में बहुत तेज़ है और डैश मॉडल के प्रक्षेपवक्र में वर्तमान जंप-सैंपलिंग बिंदु पर अवलोकनों पर आधारित अवशिष्ट प्रतिक्रिया उत्पन्न करने के लिए प्रशिक्षित है, जिससे जंप सैंपलिंग के बिना अगले चरण के डैश मॉडल अनुमान से आसानी से मेल खाने के लिए शोर अनुमान में सुधार होता है। डैश और डॉट मॉडल के आउटपुट को अस्थायी रूप से क्रॉस-लिंक करके, मोर्स समग्र रनटाइम दक्षता में सुधार करते हुए लचीले ढंग से वांछित छवि निर्माण प्रदर्शन प्राप्त करता है। डैश और डॉट मॉडल के बीच वजन साझा करने की रणनीति इसे प्रशिक्षण और अनुमान दोनों में कुशल बनाती है। यह छह इमेज जनरेशन कार्यों पर नौ बेसलाइन डिफ्यूज़न मॉडल पर 1.78x से 3.31x तक की हानि रहित गति दिखाता है, और दिखाता है कि यह कुछ-चरणीय टेक्स्ट-टू-इमेज संश्लेषण के लिए ट्यून किए गए लेटेंट कंसिस्टेंसी मॉडल (LCM-SDXL) को भी सामान्यीकृत कर सकता है। कोड और मॉडल https://github.com/deep-optimization/Morse पर उपलब्ध हैं ।

Takeaways, Limitations

Takeaways:
हम मोर्स प्रस्तुत करते हैं, जो एक प्रभावी डबल-सैंपलिंग ढांचा है जो बिना किसी हानि के प्रसार मॉडल की गति को 1.78x से 3.31x तक सुधारता है।
तीव्र कूद नमूनाकरण और अनुकूली अवशिष्ट प्रतिक्रिया रणनीतियों के माध्यम से नमूनाकरण दक्षता में उल्लेखनीय सुधार करना।
डैश और डॉट मॉडल के बीच भार साझाकरण रणनीति के माध्यम से प्रशिक्षण और अनुमान दक्षता में सुधार करना।
यह LCM-SDXL जैसे अन्य प्रसार मॉडलों पर भी प्रयोज्यता दर्शाता है।
खुले कोड और मॉडल के माध्यम से पुनरुत्पादनशीलता और प्रयोज्यता सुनिश्चित करना।
Limitations:
मोर्स के प्रदर्शन में किस हद तक सुधार हुआ है, यह प्रयुक्त अंतर्निहित प्रसार मॉडल और हाथ में मौजूद कार्य पर निर्भर करता है।
यह केवल कुछ प्रकार के प्रसार मॉडलों पर ही लागू हो सकता है (पेपर में शामिल मॉडलों के अलावा अन्य मॉडलों पर प्रदर्शन को सत्यापित करने की आवश्यकता है)।
वजन साझा करने की रणनीतियों के विस्तृत प्रभावों और सीमाओं के आगे विश्लेषण की आवश्यकता हो सकती है।
अधिक जटिल छवि निर्माण कार्यों या उच्च-रिज़ॉल्यूशन छवि निर्माण के लिए प्रदर्शन मूल्यांकन की आवश्यकता होती है।
👍