Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

DMS-Net:Dual-Modal Multi-Scale Siamese Network for Binocular Fundus Image Classification

Created by
  • Haebom

作者

Guohao Huo, Zibo Lin, Zitong Wang, Ruiting Dai, Hao Tang

概要

本論文は、網膜疾患を診断するための双眼眼底画像ベースの新しいディープラーニングモデルであるDMS-Netを提案する。 DMS-Netは、両眼の眼底画像を同時に処理して病理学的相関関係を考慮するSiamese ResNet-152構造に基づいています。モデルは、不明瞭な病変境界と拡散性病理分布の問題を解決するために、マルチスケール適応プールと空間的注意メカニズムを使用するOmniPool Spatial Integrator Module(OSIM)を導入しました。また、両眼画像間の相互作用を強化し、モダリティに独立した表現を集約するために、Calibred Analogous Semantic Fusion Module(CASFM)を使用する。さらに、Cross-Modal Contrastive Alignment Module(CCAM)とCross-Modal Integrative Alignment Module(CIAM)を介して左右眼底画像の差別的意味情報と病変相関意味情報の集計を向上させる。 ODIR-5Kデータセットで評価した結果、DMS-Netは82.9%の精度、84.5%の再現率、83.2%のCohen's kappa係数を達成し、最先端の性能を示した。

Takeaways、Limitations

Takeaways:
双眼眼底画像を利用して網膜疾患診断の精度を向上させることができることを示した。
提案されたDMS-Netは、さまざまなモジュールを介して不明確な病変および拡散性病理学の問題を効果的に解決します。
最先端の性能を達成し、臨床的意思決定支援に貢献することができる。
今後のコードと前処理されたデータセットの公開予定。
Limitations:
ODIR-5Kデータセットのパフォーマンス評価のみが提示され、他のデータセットの一般化パフォーマンスは不確実です。
他のディープラーニングモデルとの比較分析をより詳細に提示する必要がある。
実際の臨床環境での適用性と有効性に関するさらなる研究が必要です。
👍