Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

DMS-Net:Dual-Modal Multi-Scale Siamese Network for Binocular Fundus Image Classification

Created by
  • Haebom

저자

Guohao Huo, Zibo Lin, Zitong Wang, Ruiting Dai, Hao Tang

개요

본 논문은 망막 질환 진단을 위한 쌍안(binocular) 안저 영상 기반의 새로운 딥러닝 모델인 DMS-Net을 제안한다. DMS-Net은 두 눈의 안저 영상을 동시에 처리하여 병리학적 상관관계를 고려하는 Siamese ResNet-152 구조를 기반으로 한다. 모델은 불명확한 병변 경계와 확산성 병리 분포 문제를 해결하기 위해 다중 스케일 적응형 풀링과 공간적 주의 메커니즘을 사용하는 OmniPool Spatial Integrator Module (OSIM)을 도입하였다. 또한, 양안 영상 간의 상호작용을 강화하고 모달리티에 독립적인 표현을 집계하기 위해 Calibrated Analogous Semantic Fusion Module (CASFM)을 사용한다. 더 나아가, Cross-Modal Contrastive Alignment Module (CCAM)과 Cross-Modal Integrative Alignment Module (CIAM)을 통해 좌우 안저 영상의 차별적 의미 정보와 병변 상관 의미 정보의 집계를 향상시킨다. ODIR-5K 데이터셋에서 평가한 결과, DMS-Net은 82.9%의 정확도, 84.5%의 재현율, 83.2%의 Cohen's kappa 계수를 달성하여 최첨단 성능을 보였다.

시사점, 한계점

시사점:
쌍안 안저 영상을 활용하여 망막 질환 진단의 정확도를 향상시킬 수 있음을 보여줌.
제안된 DMS-Net은 다양한 모듈을 통해 불명확한 병변 및 확산성 병리 문제를 효과적으로 해결함.
최첨단 성능을 달성하여 임상적 의사결정 지원에 기여할 수 있음.
향후 코드 및 전처리된 데이터셋 공개 예정.
한계점:
ODIR-5K 데이터셋에 대한 성능 평가만 제시되어 다른 데이터셋에 대한 일반화 성능은 불확실함.
다른 딥러닝 모델과의 비교 분석이 더욱 자세히 제시될 필요가 있음.
실제 임상 환경에서의 적용 가능성 및 효용성에 대한 추가적인 연구가 필요함.
👍