Bài báo này đề xuất DMS-Net, một mô hình học sâu mới dựa trên hình ảnh đáy mắt hai mắt để chẩn đoán bệnh võng mạc. DMS-Net dựa trên kiến trúc Siamese ResNet-152, xử lý đồng thời hình ảnh đáy mắt từ cả hai mắt và xem xét các tương quan bệnh lý. Mô hình này giới thiệu Mô-đun tích hợp không gian OmniPool (OSIM), sử dụng cơ chế gộp nhóm thích ứng đa thang đo và cơ chế chú ý không gian để giải quyết các ranh giới tổn thương không rõ ràng và phân bố bệnh lý lan tỏa. Hơn nữa, Mô-đun hợp nhất ngữ nghĩa tương tự đã hiệu chuẩn (CASFM) được sử dụng để tăng cường tương tác giữa hình ảnh hai mắt và các biểu diễn độc lập với phương thức tổng hợp. Hơn nữa, Mô-đun căn chỉnh tương phản chéo phương thức (CCAM) và Mô-đun căn chỉnh tích hợp chéo phương thức (CIAM) tăng cường tổng hợp thông tin ngữ nghĩa phân biệt và tương quan với tổn thương giữa hình ảnh đáy mắt trái và phải. Khi được đánh giá trên tập dữ liệu ODIR-5K, DMS-Net đạt hiệu suất tiên tiến với độ chính xác 82,9%, khả năng thu hồi 84,5% và hệ số Cohen kappa là 83,2%.