Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

DMS-Net: Mạng lưới đa tỷ lệ đa mô thức kép dùng để phân loại hình ảnh đáy mắt hai mắt

Created by
  • Haebom

Tác giả

Guohao Huo, Zibo Lin, Zitong Wang, Ruiting Dai, Hao Tang

Phác thảo

Bài báo này đề xuất DMS-Net, một mô hình học sâu mới dựa trên hình ảnh đáy mắt hai mắt để chẩn đoán bệnh võng mạc. DMS-Net dựa trên kiến ​​trúc Siamese ResNet-152, xử lý đồng thời hình ảnh đáy mắt từ cả hai mắt và xem xét các tương quan bệnh lý. Mô hình này giới thiệu Mô-đun tích hợp không gian OmniPool (OSIM), sử dụng cơ chế gộp nhóm thích ứng đa thang đo và cơ chế chú ý không gian để giải quyết các ranh giới tổn thương không rõ ràng và phân bố bệnh lý lan tỏa. Hơn nữa, Mô-đun hợp nhất ngữ nghĩa tương tự đã hiệu chuẩn (CASFM) được sử dụng để tăng cường tương tác giữa hình ảnh hai mắt và các biểu diễn độc lập với phương thức tổng hợp. Hơn nữa, Mô-đun căn chỉnh tương phản chéo phương thức (CCAM) và Mô-đun căn chỉnh tích hợp chéo phương thức (CIAM) tăng cường tổng hợp thông tin ngữ nghĩa phân biệt và tương quan với tổn thương giữa hình ảnh đáy mắt trái và phải. Khi được đánh giá trên tập dữ liệu ODIR-5K, DMS-Net đạt hiệu suất tiên tiến với độ chính xác 82,9%, khả năng thu hồi 84,5% và hệ số Cohen kappa là 83,2%.

Takeaways, Limitations

Takeaways:
Chúng tôi chứng minh rằng chụp đáy mắt hai mắt có thể cải thiện độ chính xác trong chẩn đoán bệnh võng mạc.
DMS-Net được đề xuất giải quyết hiệu quả các vấn đề về tổn thương không rõ ràng và bệnh lý lan tỏa thông qua nhiều mô-đun khác nhau.
Nó có thể góp phần hỗ trợ quyết định lâm sàng bằng cách đạt được hiệu suất tiên tiến.
Mã và bộ dữ liệu được xử lý trước sẽ được phát hành trong tương lai.
Limitations:
Chỉ có đánh giá hiệu suất trên tập dữ liệu ODIR-5K được trình bày, do đó hiệu suất tổng quát trên các tập dữ liệu khác vẫn chưa chắc chắn.
Cần có một phân tích so sánh chi tiết hơn với các mô hình học sâu khác.
Cần nghiên cứu thêm để xác định tính ứng dụng và tiện ích của nó trong bối cảnh lâm sàng thực tế.
👍