Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

WaveHiT-SR: Hierarchical Wavelet Network for Efficient Image Super-Resolution

Created by
  • Haebom

作者

Fayaz Ali, Muhammad Zawish, Steven Davy, Radu Timofte

概要

この論文では、階層型トランスフォーマフレームワーク内にウェーブレット変換を組み込んだ新しい画像超高解像度(SR)方法であるWaveHiT-SRを提案します。既存のトランスベースのSR方式の限られた収容領域を克服するために、固定された小さなウィンドウの代わりに適応階層ウィンドウを使用してさまざまなレベルの特徴をキャプチャし、長距離依存性モデリング能力を向上させます。さらに、ウェーブレット変換を使用して画像を複数の周波数帯域に分解し、グローバルとローカルの両方の特徴に集中しながら構造的ディテールを保存します。階層的処理により高解像度画像を徐々に再構成し、計算の複雑さを軽減しながら性能低下を防止する。様々な実験により、WaveHiT-SRの効果と効率性を確認し、SwinIR-Light、SwinIR-NG、SRFormer-Lightの改良版を通じて、より高い効率性(より少ないパラメータ、低いFLOPs、より速い速度)と最先端のSR結果を達成しました。

Takeaways、Limitations

Takeaways:
適応階層ウィンドウとウェーブレット変換を組み合わせることで、計算の複雑さを低減しながら、画像の超高解像度性能を向上させることができることを示した。
従来の優れたトランスベースのSRモデルよりも高い効率(少ないパラメータ、低FLOP、高速)を達成。
さまざまな周波数帯域での特徴抽出により、詳細をよりよく保存しながら高解像度画像を生成します。
Limitations:
提案された方法の性能が特定の種類の画像またはデータセットに偏っている可能性がある。
ウェーブレット変換のパラメータ設定によってはパフォーマンスが影響を受ける可能性があります。最適なパラメータ設定に関するさらなる研究が必要
他の最先端のSR法とのより包括的な比較分析が必要です。
👍