본 논문은 비지도 비디오 분할 문제에 대한 효율적인 해결책을 제시합니다. 기존의 복잡하고 계산 비용이 높은 슬롯 어텐션 기반 모델들의 한계를 극복하기 위해, 지식 증류 프레임워크인 SlotMatch를 제안합니다. SlotMatch는 코사인 유사도를 이용하여 teacher 모델과 student 모델의 슬롯을 정렬하며, 추가적인 손실 함수나 보조적인 지도 학습 없이도 효과적으로 객체 중심 표현을 전달합니다. 이론적 및 실험적 증거를 통해 추가적인 손실 함수 통합의 불필요성을 확인하고, 실험 결과를 통해 경량화된 student 모델이 teacher 모델과 비슷하거나 더 나은 성능을 보이며, 파라미터 수는 3.6배 적고 속도는 1.9배 빠름을 보여줍니다. 기존의 비지도 비디오 분할 모델들보다 우수한 성능을 달성합니다.