この論文は、ビジョントランス(ViTs)の主なLimitationsである周波数損失問題を解決するために、周波数ダイナミックアテンション変調(FDAM)技術を提案します。従来のViTsのアテンションメカニズムは低周波フィルタとして機能し、詳細な情報と質感が失われる問題があります。 SegFormer、DeiT、MaskDINOなど、さまざまなモデルでセマンティックスプリット、オブジェクト検出、インスタンス分割などの課題でパフォーマンスが向上し、特にリモートセンシング検出の分野で最先端のパフォーマンスを実現します。