Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

GL-PGENet: A Parameterized Generation Framework for Robust Document Image Enhancement

Created by
  • Haebom

作者

Zhihong Tang

GL-PGENet: Global with Local Parametric Generation Enhancement Network

概要

GL-PGENetは、複数の劣化したカラー文書画像を強化するために設計された新しいアーキテクチャです。グローバルな外観補正とローカルセグメンテーションを統合した階層強化フレームワーク、ピクセル単位マッピングの代わりに学習された中間パラメータ表現を通じて強化された出力を生成するパラメータ生成メカニズムを備えたDual-Branch Local-Refine Network、およびドキュメントイメージ特性に合わせて調整されたdense blockを統合した修正NestUNetアーキテクチャを特徴とします。 500,000以上のサンプルを含む合成データセットの大規模な事前トレーニングとタスクごとの微調整を実行する2段階のトレーニング戦略を使用します。

Takeaways、Limitations

複数劣化したカラー文書画像の向上に効果的な新しいアーキテクチャを提示
グローバルアプローチとローカルアプローチを組み合わせて画質を向上
パラメータ生成メカニズムを使用したモデルの一般化性能の向上
状態 - 芸術性能を達成し、クロスドメイン適応性と計算効率を維持
実際のシナリオで実用的な有用性を実証
論文ではLimitationsは指定されていません
👍