본 논문은 비지도 비디오 분할(Unsupervised video segmentation) 문제에 대해, 대규모 계산 비용이 드는 기존의 slot attention 기반 모델의 한계를 극복하기 위해 경량화된 학생 모델에 객체 중심 표현을 효과적으로 전달하는 지식 증류 프레임워크인 SlotMatch를 제안한다. SlotMatch는 코사인 유사도를 이용하여 teacher와 student 슬롯을 정렬하며, 추가적인 증류 목표 또는 보조 감독 없이 동작한다. 이론적 및 실험적 증거를 통해 추가 손실 함수 통합의 불필요성을 보이며, 실험 결과 SlotMatch 기반 학생 모델은 기존 최고 성능의 teacher 모델인 SlotContrast와 비교하여 매개변수 수는 3.6배 적고, 속도는 1.9배 빠르면서도 성능이 동등하거나 더 우수함을 보여준다. 또한 기존의 비지도 비디오 분할 모델들을 능가하는 성능을 달성한다.