본 논문은 3D 의료 영상 분할에서 슬라이딩 윈도우(SW) 기반 추론의 속도 저하 문제를 해결하기 위해 No-More-Sliding-Window (NMSW) 프레임워크를 제안합니다. NMSW는 차별 가능한 Top-k 모듈을 사용하여 관련성이 높은 패치만 선택적으로 샘플링하여 불필요한 계산을 최소화합니다. 패치 수준 예측이 부족한 경우, 전역 예측을 활용하여 결과를 개선합니다. 다양한 3D 분할 백본과 과제에 대한 평가 결과, NMSW는 SW 추론과 비교하여 경쟁력 있는 정확도를 달성하면서 계산 복잡도를 91% 감소시키고, H100 GPU에서는 9.1배, Xeon Gold CPU에서는 11.1배 빠른 추론 속도를 보였습니다. 모델 독립적인 특성으로 기존의 효율적인 분할 백본과 통합하여 효율성을 더욱 높일 수 있습니다.