본 논문은 조직 슬라이드 전체 이미지(WSI)를 계산 병리학에 효율적으로 통합하기 위한 중요한 단계인 각 WSI에 단일 고품질 특징 벡터(임베딩)를 할당하는 방법에 대해 다룹니다. 기존의 사전 훈련된 심층 신경망과 기초 모델의 등장으로 하위 이미지(타일 또는 패치)에 대한 임베딩 추출은 간단하지만, 고해상도 및 기가픽셀 특성의 WSI는 기존 GPU에 단일 이미지로 입력하는 것이 불가능합니다. 따라서 WSI는 여러 패치로 분할되고, 각 패치를 사전 훈련된 모델에 입력하여 각 WSI를 패치 집합, 즉 임베딩 집합으로 나타냅니다. 이러한 설정에서 WSI 표현 학습은 집합 표현 학습으로 축소되며, 각 WSI에 대해 패치 임베딩 집합에 접근할 수 있습니다. 본 논문에서는 단순 평균 또는 최대 풀링 연산, Deep Sets, 메모리 네트워크, Focal attention, Gaussian Mixture Model (GMM) Fisher Vector, 심층 희소 및 이진 Fisher Vector를 포함한 최근 개발된 여러 집합 기반 학습 기법(주로 집합 표현 학습 기법)의 WSI 검색 성능을 TCGA의 방광, 유방, 신장, 결장 등 네 가지 주요 부위에서 평가합니다. 또한, 이러한 방법들의 검색 성능을 WSI 검색에 사용되는 비집계 방식인 패치 임베딩의 최소 거리 중앙값과 비교 분석합니다.