यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
मोर्स: प्रसार मॉडल के हानि रहित त्वरण के लिए दोहरी-नमूनाकरण
Created by
Haebom
लेखक
चाओ ली, जियावेई फैन, अनबांग याओ
रूपरेखा
इस शोधपत्र में, हम मोर्स प्रस्तुत करते हैं, जो एक सरल दोहरे-नमूनाकरण ढाँचा है जो बिना किसी नुकसान के प्रसार मॉडल की गति में सुधार करता है। मोर्स तेज़ जंप सैंपलिंग और एक अनुकूली अवशिष्ट प्रतिक्रिया रणनीति का उपयोग करके पुनरावृत्त निर्माण प्रक्रिया (शोर से डेटा तक) का पुनर्निर्माण करता है। दो मॉडल, डैश और डॉट, परस्पर क्रिया करते हैं। डैश मॉडल एक मौजूदा पूर्व-प्रशिक्षित प्रसार मॉडल है जो बेहतर नमूनाकरण दक्षता के लिए स्थान सुरक्षित करने के लिए जंप-सैंपलिंग तरीके से संचालित होता है। डॉट मॉडल डैश मॉडल की तुलना में बहुत तेज़ है और डैश मॉडल के प्रक्षेपवक्र में वर्तमान जंप-सैंपलिंग बिंदु पर अवलोकनों पर आधारित अवशिष्ट प्रतिक्रिया उत्पन्न करने के लिए प्रशिक्षित है, जिससे जंप सैंपलिंग के बिना अगले चरण के डैश मॉडल अनुमान से आसानी से मेल खाने के लिए शोर अनुमान में सुधार होता है। डैश और डॉट मॉडल के आउटपुट को अस्थायी रूप से क्रॉस-लिंक करके, मोर्स समग्र रनटाइम दक्षता में सुधार करते हुए लचीले ढंग से वांछित छवि निर्माण प्रदर्शन प्राप्त करता है। डैश और डॉट मॉडल के बीच वजन साझा करने की रणनीति इसे प्रशिक्षण और अनुमान दोनों में कुशल बनाती है। यह छह इमेज जनरेशन कार्यों पर नौ बेसलाइन डिफ्यूज़न मॉडल पर 1.78x से 3.31x तक की हानि रहित गति दिखाता है, और दिखाता है कि यह कुछ-चरणीय टेक्स्ट-टू-इमेज संश्लेषण के लिए ट्यून किए गए लेटेंट कंसिस्टेंसी मॉडल (LCM-SDXL) को भी सामान्यीकृत कर सकता है। कोड और मॉडल https://github.com/deep-optimization/Morse पर उपलब्ध हैं ।