दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

एसएसगॉसियन: अर्थ-जागरूक और संरचना-संरक्षण 3D शैली स्थानांतरण

Created by
  • Haebom

लेखक

जिमिन जू, बोशेंग किन, ताओ जिन, झोउ झाओ, झेनहुई ये, जून यू, फी वू

रूपरेखा

यह पत्र एक नवीन 3D शैली स्थानांतरण पाइपलाइन का प्रस्ताव करता है जो पूर्व-प्रशिक्षित 2D प्रसार मॉडलों से प्राप्त ज्ञान का लाभ उठाकर मौजूदा 3D शैली स्थानांतरण विधियों की चुनौतियों का समाधान करता है, जो उच्च-आयामी शैली अर्थविज्ञान को प्रभावी ढंग से निकालने और स्थानांतरित करने में संघर्ष करती हैं और परिणामी शैली अनुप्रयोग में संरचनात्मक अस्पष्टता से ग्रस्त होती हैं, जिससे वस्तु की पहचान कठिन हो जाती है। इस पाइपलाइन में दो चरण होते हैं: प्रमुख दृष्टिकोणों के शैलीबद्ध प्रतिपादन उत्पन्न करना और फिर उन्हें 3D अभ्यावेदन में स्थानांतरित करना। विशेष रूप से, क्रॉस-व्यू शैली संरेखण कई प्रमुख दृष्टिकोणों में विशेषता अंतःक्रियाओं को सक्षम बनाता है, और इंस्टेंस-स्तरीय शैली स्थानांतरण प्रभावी रूप से शैलीबद्ध प्रमुख दृष्टिकोणों के बीच 3D अभ्यावेदन में संगति स्थानांतरित करता है, जिसके परिणामस्वरूप संरचनात्मक और दृष्टिगत रूप से सुसंगत शैलीकरण परिणाम प्राप्त होते हैं। विभिन्न दृश्यों पर प्रायोगिक परिणाम दर्शाते हैं कि प्रस्तावित विधि मौजूदा अत्याधुनिक विधियों से बेहतर प्रदर्शन करती है।

Takeaways, Limitations

Takeaways:
हम एक नवीन पाइपलाइन प्रस्तुत करते हैं जो पूर्व-प्रशिक्षित 2D प्रसार मॉडल का लाभ उठाकर 3D शैली स्थानांतरण समस्या को प्रभावी ढंग से हल करती है।
क्रॉस-व्यू शैली संरेखण और इंस्टेंस-स्तर शैली स्थानांतरण तकनीकें एक साथ शैली निष्ठा और इंस्टेंस-स्तर स्थिरता में सुधार करती हैं।
इसने विभिन्न दृश्यों (सामने, 360 डिग्री वातावरण, आदि) में मौजूदा तरीकों की तुलना में बेहतर प्रदर्शन दिखाया।
Limitations:
2D प्रसार मॉडल पर उच्च निर्भरता के कारण, 3D शैली स्थानांतरण परिणामों की गुणवत्ता 2D प्रसार मॉडल के प्रदर्शन से प्रभावित हो सकती है।
कम्प्यूटेशनल लागत अधिक हो सकती है (हालांकि स्पष्ट रूप से नहीं बताया गया है, 2D प्रसार मॉडल और 3D प्रतिनिधित्व प्रसंस्करण की जटिलता को देखते हुए यह अपेक्षित है Limitations)
प्रस्तावित विधि के सामान्यीकरण प्रदर्शन को निर्धारित करने के लिए और अधिक शोध की आवश्यकता है। (हालांकि स्पष्ट रूप से नहीं बताया गया है, यह अनुमान है कि आगे और शोध आवश्यक होगा, क्योंकि किसी विशिष्ट डेटासेट पर बेहतर प्रदर्शन सभी डेटासेट पर बेहतर प्रदर्शन की गारंटी नहीं देता है।)
👍