दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

वाइड-एंगल छवियों से परे: अप्रशिक्षित स्थानिक-समय अनुकूलन के माध्यम से संरचना-से-विस्तार वीडियो पोर्ट्रेट सुधार

Created by
  • Haebom

लेखक

वेनबो नी, लैंग नी, चुन्यू लिन, जिंगवेन चेन, के जिंग, जियुआन वांग, कांग लियाओ

रूपरेखा

वाइड-एंगल कैमरों के कारण होने वाली चेहरे की विकृति की समस्या का समाधान करने के लिए, यह शोधपत्र ImagePC का प्रस्ताव करता है, जो एक संरचनात्मक-विस्तार पोर्ट्रेट सुधार मॉडल है जो ट्रांसफॉर्मर्स से लंबी दूरी की पहचान और प्रसार मॉडल से बहु-चरणीय शोर-निवारण को एकीकृत करता है। वीडियो लेबल प्राप्त करने की कठिनाई को ध्यान में रखते हुए, हम VideoPC का प्रस्ताव करते हैं, जो लेबल-रहित वाइड-एंगल वीडियो के लिए ImagePC का एक पुनर्प्रयोजनित संस्करण है, जो स्थानिक संगति और कालिक सुगमता प्रतिबंधों के साथ स्थानिक-कालिक प्रसार अनुकूलन का उपयोग करता है। VideoPC उच्च-गुणवत्ता वाले स्थानिक चेहरे के सुधार को बनाए रखते हुए, अंधेपन वाले परिदृश्यों में क्रमिक रूप से कालिक धुंधलापन कम करता है। हम प्रदर्शन का मूल्यांकन करते हैं और मॉडल को विभिन्न प्रकार के लोगों, प्रकाश स्थितियों और पृष्ठभूमियों वाले वीडियो पोर्ट्रेट डेटासेट पर प्रशिक्षित करते हैं, और प्रयोगों के माध्यम से प्रदर्शित करते हैं कि यह गुणात्मक और मात्रात्मक दोनों ही दृष्टि से मौजूदा विधियों से बेहतर प्रदर्शन करता है। कोड और डेटासेट भविष्य में सार्वजनिक किए जाएँगे।

Takeaways, Limitations

Takeaways:
वाइड-एंगल कैमरा विरूपण के कारण चेहरे की विकृति की समस्या का एक प्रभावी समाधान।
ट्रांसफार्मर और प्रसार मॉडल को एकीकृत करने वाला एक नया संरचनात्मक-विस्तार पोर्ट्रेट सुधार मॉडल प्रस्तावित किया गया है।
हम वीडियोपीसी का प्रस्ताव रखते हैं, जो गैर-प्रदर्शित वीडियो के लिए एक प्रभावी क्षतिपूर्ति तकनीक है।
एक नया वीडियो पोर्ट्रेट डेटासेट बनाना और जारी करना जिसमें विभिन्न प्रकार की स्थितियां शामिल हों।
मौजूदा तरीकों की तुलना में मात्रात्मक और गुणात्मक बेहतर प्रदर्शन का प्रदर्शन किया।
Limitations:
प्रस्तावित मॉडल की कम्प्यूटेशनल लागत और जटिलता के विश्लेषण का अभाव।
विभिन्न प्रकार की विकृति के लिए सामान्यीकरण निष्पादन मूल्यांकन का अभाव।
वास्तविक अनुप्रयोग वातावरण में प्रदर्शन मूल्यांकन का अभाव।
वीडियोपीसी की कालिक सुगमता बाधाओं की प्रभावशीलता और सीमाओं पर आगे विश्लेषण की आवश्यकता है।
👍