दैनिक अर्क्सिव

यह पेज दुनियाभर में प्रकाशित होने वाले आर्टिफिशियल इंटेलिजेंस संबंधित रिसर्च पेपर्स को संक्षिप्त रूप में प्रस्तुत करता है।
यहां Google Gemini का उपयोग करके पेपर्स का सारांश तैयार किया जाता है और यह पेज गैर-लाभकारी रूप से संचालित किया जाता है।
पेपर के कॉपीराइट लेखक और संबंधित संस्थान के पास हैं, और साझा करते समय बस स्रोत का उल्लेख करें।

WaveHiT-SR: कुशल छवि सुपर-रिज़ॉल्यूशन के लिए पदानुक्रमित वेवलेट नेटवर्क

Created by
  • Haebom

लेखक

फ़ैयाज़ अली, मुहम्मद ज़विश, स्टीवन डेवी, राडू टिमोफ़्टे

रूपरेखा

इस पत्र में, हम WaveHiT-SR, एक नवीन इमेज सुपर-रिज़ॉल्यूशन (SR) विधि प्रस्तावित करते हैं जो वेवलेट ट्रांसफ़ॉर्म को एक पदानुक्रमित ट्रांसफ़ॉर्मर ढाँचे में एकीकृत करती है। मौजूदा ट्रांसफ़ॉर्मर-आधारित SR विधियों की सीमित ग्रहणशील सीमा को पार करने के लिए, हम विभिन्न स्तरों पर विशेषताओं को पकड़ने और लंबी दूरी की निर्भरताओं को मॉडल करने की क्षमता को बढ़ाने के लिए स्थिर, छोटी खिड़कियों के बजाय अनुकूली पदानुक्रमित खिड़कियों का उपयोग करते हैं। इसके अलावा, हम वैश्विक और स्थानीय दोनों विशेषताओं पर ध्यान केंद्रित करते हुए संरचनात्मक विवरणों को संरक्षित करते हुए, छवियों को कई आवृत्ति बैंडों में विघटित करने के लिए वेवलेट ट्रांसफ़ॉर्म का उपयोग करते हैं। पदानुक्रमित प्रसंस्करण उच्च-रिज़ॉल्यूशन छवियों के क्रमिक पुनर्निर्माण की अनुमति देता है, जिससे प्रदर्शन में गिरावट को न्यूनतम करते हुए गणना संबंधी जटिलता कम होती है। हम व्यापक प्रयोगों के माध्यम से WaveHiT-SR की प्रभावशीलता और दक्षता का प्रदर्शन करते हैं, और यह दर्शाते हैं कि SwinIR-Light, SwinIR-NG, और SRFormer-Light के उन्नत संस्करण उच्च दक्षता (कम पैरामीटर, कम FLOP, और तेज़ गति) और अत्याधुनिक SR परिणाम प्राप्त करते हैं।

Takeaways, Limitations

Takeaways:
हम प्रदर्शित करते हैं कि अनुकूली पदानुक्रमित विंडोइंग और वेवलेट ट्रांसफॉर्म के संयोजन से कम्प्यूटेशनल जटिलता को कम करते हुए छवि सुपर-रिज़ॉल्यूशन प्रदर्शन में सुधार किया जा सकता है।
मौजूदा उत्कृष्ट ट्रांसफार्मर-आधारित एसआर मॉडल की तुलना में उच्च दक्षता (कम पैरामीटर, कम एफएलओपी, तेज गति) प्राप्त करता है।
विभिन्न आवृत्ति बैंडों में फीचर निष्कर्षण के माध्यम से विवरणों को बेहतर ढंग से संरक्षित करते हुए उच्च-रिज़ॉल्यूशन वाली छवियां उत्पन्न करें।
Limitations:
ऐसी संभावना है कि प्रस्तावित विधि का प्रदर्शन कुछ विशेष प्रकार की छवियों या डेटासेट के प्रति पक्षपाती हो सकता है।
वेवलेट ट्रांसफ़ॉर्म पैरामीटर सेटिंग्स से प्रदर्शन प्रभावित हो सकता है। इष्टतम पैरामीटर सेटिंग्स निर्धारित करने के लिए और अधिक शोध की आवश्यकता है।
अन्य अत्याधुनिक एसआर विधियों के साथ अधिक व्यापक तुलनात्मक विश्लेषण की आवश्यकता है।
👍