Bài báo này đề xuất DS²Net, một mạng lưới giám sát sâu mới dùng cho phân đoạn ảnh y tế. Không giống như các nghiên cứu trước đây chỉ giám sát các đặc điểm chi tiết cấp thấp hoặc các đặc điểm ngữ nghĩa cấp cao, DS²Net đồng thời giám sát cả các đặc điểm chi tiết cấp thấp và các đặc điểm ngữ nghĩa cấp cao thông qua mô-đun tăng cường đặc điểm chi tiết (DEM) và mô-đun tăng cường đặc điểm ngữ nghĩa (SEM). DEM và SEM lần lượt sử dụng các bản đồ đặc điểm cấp thấp và cấp cao để tạo ra các mặt nạ chi tiết và ngữ nghĩa, tăng cường giám sát đặc điểm. Hơn nữa, chúng tôi đưa vào một tổn thất giám sát dựa trên sự không chắc chắn để phân bổ cường độ giám sát một cách thích ứng cho các đặc điểm ở mỗi thang đo, giải quyết các thách thức về thiết kế heuristic không hiệu quả của các nghiên cứu trước đây. Thông qua các thử nghiệm mở rộng trên sáu điểm chuẩn ảnh y tế, bao gồm ảnh nội soi đại tràng, siêu âm và kính hiển vi, chúng tôi chứng minh rằng DS²Net vượt trội hơn các phương pháp tiên tiến.