본 논문은 망막 질환 진단을 위한 쌍안(binocular) 안저 영상 기반의 새로운 딥러닝 모델인 DMS-Net을 제안한다. DMS-Net은 두 눈의 안저 영상을 동시에 처리하여 병리학적 상관관계를 고려하는 Siamese ResNet-152 구조를 기반으로 한다. 모델은 불명확한 병변 경계와 확산성 병리 분포 문제를 해결하기 위해 다중 스케일 적응형 풀링과 공간적 주의 메커니즘을 사용하는 OmniPool Spatial Integrator Module (OSIM)을 도입하였다. 또한, 양안 영상 간의 상호작용을 강화하고 모달리티에 독립적인 표현을 집계하기 위해 Calibrated Analogous Semantic Fusion Module (CASFM)을 사용한다. 더 나아가, Cross-Modal Contrastive Alignment Module (CCAM)과 Cross-Modal Integrative Alignment Module (CIAM)을 통해 좌우 안저 영상의 차별적 의미 정보와 병변 상관 의미 정보의 집계를 향상시킨다. ODIR-5K 데이터셋에서 평가한 결과, DMS-Net은 82.9%의 정확도, 84.5%의 재현율, 83.2%의 Cohen's kappa 계수를 달성하여 최첨단 성능을 보였다.