Este artículo propone DS²Net, una novedosa red supervisada profunda para la segmentación de imágenes médicas. A diferencia de estudios previos que supervisan características de grano fino de bajo nivel o características semánticas de alto nivel, DS²Net supervisa simultáneamente tanto características de grano fino de bajo nivel como características semánticas de alto nivel mediante un módulo de mejora de características de grano fino (DEM) y un módulo de mejora de características semánticas (SEM). El DEM y el SEM, respectivamente, utilizan mapas de características de bajo y alto nivel para generar máscaras de grano fino y semánticas, lo que mejora la supervisión de características. Además, introducimos una pérdida de supervisión basada en la incertidumbre para asignar adaptativamente la intensidad de la supervisión a las características en cada escala, abordando así los desafíos ineficientes del diseño heurístico de estudios previos. Mediante experimentos exhaustivos en seis parámetros de referencia de imágenes médicas, incluyendo imágenes de colonoscopia, ultrasonido y microscopía, demostramos que DS²Net supera a los métodos más avanzados.