본 논문은 전통적인 Bag-based Multiple Instance Learning (MIL) 기반 Whole Slide Image (WSI) 분류 방법의 한계점을 지적하고, 이를 극복하기 위한 새로운 end-to-end multi-scale WSI 분류 프레임워크를 제시한다. 기존 방법들의 주요 문제점으로는, 1) 특징 추출 네트워크와 MIL 네트워크 간의 협력적 최적화 부족으로 인한 성능 저하, 2) 고정된 크기의 패치에서만 특징을 추출하여 다중 스케일 관찰 특성을 무시함으로써 계산 자원 낭비 및 최적화 실패 가능성 발생을 지적한다. 제안된 프레임워크는 1) 비병변 영역의 간섭을 줄이는 의미적 특징 필터링 모듈, 2) 다양한 수준의 병리 정보를 포착하는 다중 스케일 특징 추출 모듈, 3) 전역 모델링 및 특징 통합을 위한 다중 스케일 융합 MIL 모듈을 포함하며, end-to-end 학습을 통해 특징 추출기와 MIL 네트워크를 동시에 최적화한다. DigestPath2019, BCNB, UBC-OCEAN 세 개의 cross-center 데이터셋을 이용한 실험 결과, 제안된 방법이 기존 최첨단 방법보다 정확도(ACC)와 AUC 측면에서 우수한 성능을 보였다고 보고한다.