Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

DMS-Net: Mạng lưới đa tỷ lệ đa mô thức kép dùng để phân loại hình ảnh đáy mắt hai mắt

Created by
  • Haebom

Tác giả

Guohao Huo, Zibo Lin, Zitong Wang, Ruiting Dai, Hao Tang

Phác thảo

Trong bài báo này, chúng tôi đề xuất một mạng lưới Siamese đa thang đo kép, DMS-Net, để phân loại ảnh đáy mắt hai mắt. DMS-Net trích xuất các đặc điểm ngữ nghĩa sâu từ ảnh đáy mắt ghép đôi bằng cách sử dụng xương sống Siamese ResNet-152 chia sẻ trọng số. Để giải quyết các vấn đề như sự mơ hồ ranh giới tổn thương và phân bố bệnh lý rải rác, chúng tôi giới thiệu một mô-đun nhận biết ngữ cảnh đa thang đo (MSCAM) tích hợp các cơ chế tập hợp thích ứng và chú ý. Ngoài ra, chúng tôi kết hợp hiệu quả các đặc điểm ngữ cảnh toàn cục và cạnh cục bộ bằng cách tăng cường tương tác xuyên mô-đun bằng cách sử dụng hiệu chuẩn lại ngữ nghĩa không gian và chú ý hai chiều thông qua mô-đun hợp nhất đặc điểm kép (DMFF). Khi được đánh giá trên tập dữ liệu ODIR-5K, DMS-Net đạt hiệu suất tiên tiến với độ chính xác 82,9%, khả năng thu hồi 84,5% và hệ số Cohen's kappa là 83,2%, thể hiện khả năng vượt trội trong việc phát hiện các bệnh lý đối xứng và thúc đẩy quá trình ra quyết định lâm sàng cho các bệnh về mắt.

Takeaways, Limitations

Takeaways:
Cải thiện độ chính xác của chẩn đoán bệnh về mắt bằng cách xem xét mối tương quan giữa hình ảnh đáy mắt hai mắt.
Giải quyết vấn đề mơ hồ về ranh giới tổn thương và phân bố bệnh lý rải rác bằng mô-đun MSCAM và DMFF.
ĐạT hiệu suất tiên tiến nhất trên tập dữ liệu ODIR-5K (độ chính xác 82,9%, khả năng thu hồi 84,5%, hệ số Cohen's kappa 83,2%).
Góp phần chẩn đoán các bệnh về mắt và hỗ trợ ra quyết định lâm sàng.
Limitations:
Chỉ có xác thực hiệu suất trên tập dữ liệu ODIR-5K được trình bày, do đó hiệu suất tổng quát trên các tập dữ liệu khác vẫn chưa chắc chắn.
Chi phí tính toán và mức tiêu thụ tài nguyên tiềm ẩn do tính phức tạp của mô hình.
Cần có thêm nhiều nghiên cứu nữa để khái quát hiệu suất trên nhiều tình trạng bệnh lý về nhãn khoa.
👍