यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है। यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है। पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।
यह शोधपत्र एक पोर्ट्रेट शैली स्थानांतरण विधि प्रस्तुत करता है जो विभिन्न क्षेत्रों में व्यापक होती है और बाल, आँखें, पलकें, त्वचा, होंठ और पृष्ठभूमि जैसे क्षेत्रों के लिए उच्च-गुणवत्ता वाले अर्थपूर्ण संरेखित शैली स्थानांतरण को सक्षम बनाती है। इसके लिए, हम एक पूर्व-प्रशिक्षित मॉडल और एक अर्थपूर्ण एडाप्टर के आधार पर दिए गए इनपुट और संदर्भ पोर्ट्रेट के बीच एक सघन अर्थपूर्ण संगति स्थापित करके एक विकृत संदर्भ प्राप्त करते हैं जो इनपुट के साथ अर्थपूर्ण रूप से संरेखित होता है। कुशल और नियंत्रणीय शैली स्थानांतरण सुनिश्चित करने के लिए, हमने AdaIN-वेवलेट रूपांतरण तैयार किया है जो विकृत संदर्भ की निम्न-आवृत्ति सूचना को लेटेंट स्पेस में इनपुट की उच्च-आवृत्ति सूचना के साथ मिश्रित करके सामग्री संरक्षण और शैली स्थानांतरण को संतुलित करता है। हमने एक शैली एडाप्टर भी डिज़ाइन किया है जो विकृत संदर्भ से शैली मार्गदर्शन प्रदान करता है। AdaIN-वेवलेट रूपांतरण से प्राप्त शैलीकृत लेटेंट स्पेस का उपयोग करते हुए, हम एक द्वि-सशर्त विसरण मॉडल का उपयोग करके अंतिम परिणाम उत्पन्न करते हैं जो ControlNet को एकीकृत करता है, जो उच्च-आवृत्ति सूचना और शैली मार्गदर्शन को रिकॉर्ड करता है। हम व्यापक प्रयोगों के माध्यम से प्रस्तावित विधि की श्रेष्ठता प्रदर्शित करते हैं। कोड और प्रशिक्षित मॉडल https://github.com/wangxb29/DGPST पर उपलब्ध हैं ।