Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

SegNet nâng cao với Grad-CAM tích hợp để phân đoạn lớp võng mạc có thể diễn giải được trong hình ảnh OCT

Created by
  • Haebom

Tác giả

SM Asiful Islam Saky, Ugyen Tshering

Phác thảo

Bài báo này đề xuất một khuôn khổ học sâu dựa trên SegNet cải tiến để phân đoạn lớp võng mạc trong hình ảnh chụp cắt lớp quang học (OCT), điều này rất cần thiết để chẩn đoán các bệnh như bệnh tăng nhãn áp, bệnh võng mạc tiểu đường và thoái hóa điểm vàng do tuổi tác. Để giải quyết những hạn chế của các mô hình học sâu hiện có, vốn thiếu khả năng diễn giải và yêu cầu phân đoạn thủ công tốn thời gian và có tính biến thiên cao, chúng tôi sử dụng các cải tiến về cấu trúc, bao gồm chiến lược gộp đã sửa đổi, để tăng cường trích xuất đặc trưng từ hình ảnh OCT nhiễu. Hơn nữa, chúng tôi cải thiện hiệu suất bằng cách sử dụng hàm mất mát lai kết hợp mất mát entropy chéo phân loại và mất mát Dice. Hơn nữa, chúng tôi tích hợp Grad-CAM, cung cấp giải thích trực quan về các quyết định của mô hình, cho phép xác thực lâm sàng. Việc đào tạo và xác thực trên tập dữ liệu Duke OCT mang lại độ chính xác xác thực là 95,77%, hệ số Dice là 0,9446 và Chỉ số can thiệp Jaccard (IoU) là 0,8951. Mặc dù mô hình gặp khó khăn với các cạnh mỏng, nhưng nó hoạt động mạnh mẽ trên hầu hết các lớp. Hình ảnh hóa Grad-CAM làm nổi bật các vùng có liên quan về mặt giải phẫu, đồng bộ kết quả phân đoạn với các dấu ấn sinh học lâm sàng và tăng cường tính minh bạch. Chúng tôi trình bày một khung SegNet hiệu suất cao, thu hẹp khoảng cách giữa độ chính xác và khả năng diễn giải bằng cách kết hợp tinh chỉnh cấu trúc, tùy chỉnh tổn thất lai và AI có thể giải thích được. Phương pháp này mang lại tiềm năng mạnh mẽ để chuẩn hóa phân tích OCT, cải thiện hiệu quả chẩn đoán và nâng cao niềm tin lâm sàng vào các công cụ nhãn khoa dựa trên AI.

Takeaways, Limitations

Takeaways:
Một khuôn khổ học sâu dựa trên SegNet được cải tiến để phân đoạn lớp võng mạc hiệu quả trong hình ảnh OCT có nhiễu được trình bày.
Độ Chính xác được cải thiện với chiến lược gộp nhóm đã sửa đổi và hàm mất mát lai.
Cải thiện khả năng diễn giải mô hình và đề xuất tiềm năng xác nhận lâm sàng bằng cách sử dụng Grad-CAM.
Góp phần chuẩn hóa phân tích OCT và nâng cao hiệu quả chẩn đoán.
Cải thiện sự tự tin của bác sĩ lâm sàng vào các công cụ nhãn khoa dựa trên AI.
Limitations:
Cần cải thiện hiệu suất phân đoạn tại ranh giới lớp võng mạc mỏng.
Xác minh hiệu suất tổng quát là cần thiết cho nhiều thiết bị và tập dữ liệu OCT khác nhau.
Cần có thêm nghiên cứu sử dụng các tập dữ liệu lớn hơn và đa dạng hơn.
👍