दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

LoRA.rar: विषय-शैली वातानुकूलित छवि निर्माण के लिए हाइपरनेटवर्क के माध्यम से LoRAs को मर्ज करना सीखना

Created by
  • Haebom

लेखक

डोनाल्ड शेनाज, ओन्ड्रेज बोहडाल, मेटे ओज़े, पिएत्रो ज़ानुटिघ, अम्बर्टो मिचेली

रूपरेखा

यह पत्र एक अत्याधुनिक छवि निर्माण मॉडल की प्रगति पर चर्चा करता है जो उपयोगकर्ता-परिभाषित विषय वस्तु (सामग्री) और शैली दोनों के साथ वैयक्तिकृत छवि निर्माण को सक्षम बनाता है। पिछले शोध ने अनुकूलन-आधारित विधियों का उपयोग करके निम्न-रैंक एडेप्टर (LoRA) को मर्ज करके वैयक्तिकरण हासिल किया, लेकिन यह दृष्टिकोण कम्प्यूटेशनल रूप से महंगा है और स्मार्टफोन जैसे संसाधन-विवश उपकरणों पर वास्तविक समय के उपयोग के लिए अनुपयुक्त है। इस समस्या को संबोधित करने के लिए, यह पत्र एक LoRA$.$rar विधि का प्रस्ताव करता है जो छवि गुणवत्ता में सुधार करते हुए विलय प्रक्रिया को 4,000x से अधिक तेज करता है। विविध सामग्री-शैली LoRA युग्मों पर एक हाइपरनेटवर्क को पूर्व-प्रशिक्षित करके, हम एक कुशल विलय रणनीति सीखते हैं जो नई सामग्री-शैली युग्मों के लिए सामान्यीकृत होती है, एमएलएलएम और मानवीय मूल्यांकन दर्शाते हैं कि हमारी पद्धति, विषय-वस्तु और शैली निष्ठा दोनों में अत्याधुनिक पद्धति से बेहतर प्रदर्शन करती है।

Takeaways, Limitations

Takeaways:
LoRA$.$rar विधि मौजूदा अनुकूलन-आधारित LoRA विलय विधियों की तुलना में 4000 गुना अधिक तेजी से व्यक्तिगत छवि निर्माण को सक्षम बनाती है।
हम एक कुशल LoRA विलय रणनीति प्रस्तुत करते हैं जो विभिन्न सामग्री-शैली संयोजनों के लिए सामान्यीकृत है।
हम MLLM का उपयोग करते हुए एक नवीन सामग्री-शैली गुणवत्ता मूल्यांकन प्रोटोकॉल का प्रस्ताव करते हैं।
छवि गुणवत्ता और निर्माण गति में एक साथ सुधार करें।
Limitations:
प्रस्तावित एमएलएलएम-आधारित मूल्यांकन प्रोटोकॉल की व्यापकता और निष्पक्षता निर्धारित करने के लिए आगे अनुसंधान की आवश्यकता है।
LoRA$.$rar विधि का प्रदर्शन पूर्व-प्रशिक्षित हाइपरनेटवर्क के प्रदर्शन पर निर्भर हो सकता है।
विभिन्न छवि निर्माण मॉडलों के साथ संगतता के लिए आगे सत्यापन की आवश्यकता है।
👍