PAN-Sharpeningは、高解像度のパンクロマティック(PAN)画像と低解像度のマルチスペクトル(MS)画像を融合して、高解像度マルチスペクトル(HRMS)画像を生成する技術です。しかし、センサーの配置、取得時点、解像度の違いによるモダリティの間の位置合わせエラーが主な課題です。従来の深層学習方法は、完全なピクセルアライメントを想定し、ピクセル単位の再構成損失に依存してソートエラーがある場合、スペクトラルディストーション、ダブルエッジ、ブラーリングが発生します。この論文では、PANとMSモダリティの間のアライメント誤差を明示的に軽減するモダリティコンシステントアライメントフレームワークであるPAN-Crafterを提案します。重要なことに、モダリティー・アダプティブ・リコンストラクション(MAR)により、単一ネットワークがHRMSとPAN映像を共同で再構成し、PANの高周波ディテールをauxiliary self-supervisionとして活用します。また、MS textureとPAN structureを相互に整列させるCross-Modality Alignment-Aware Attention(CM3A)メカニズムを導入し、modality間の適応的特徴改善を可能にします。