En este artículo, proponemos un marco de trabajo de ventana deslizante (NMSW) para superar las deficiencias del enfoque de ventana deslizante (SW) en la segmentación de imágenes médicas 3D. NMSW minimiza la carga computacional al muestrear selectivamente solo los parches relevantes mediante un módulo top-k discriminante. Cuando las predicciones a nivel de parche son insuficientes, se utilizan predicciones globales para mejorar los resultados. Los resultados de la evaluación en tres estructuras de segmentación y tres tareas muestran que NMSW alcanza una precisión competitiva (de 88,0 a 8,00 TMAC) en comparación con el enfoque SW, a la vez que reduce la complejidad computacional en un 91 %. Además, alcanza una velocidad de inferencia 9,1 veces mayor en una GPU H100 y 11,1 veces mayor en una CPU Xeon Gold. Dado que opera de forma independiente del modelo, puede integrarse aún más con las estructuras de segmentación eficientes existentes para una mayor eficiencia.