공초점 레이저 내시경(CLE)은 비침습적, 실시간 영상 기법으로, 점액 구조의 현장, 생체 내 이미징 및 미세 구조 분석에 사용된다. 그러나 경험이 없는 의사에게는 영상 해석이 어려워 진단이 복잡하다. 머신 러닝을 보조 도구로 활용하는 것이 도움이 될 수 있지만, 이 분야의 다양한 패턴에 비해 조직 병리학과 관련된 CLE 영상 시퀀스가 부족하여 머신 러닝 모델의 과적합을 초래한다. 이를 극복하기 위해 더 큰 레이블이 없는 데이터 세트에 자기 지도 학습(SSL)을 사용할 수 있다. CLE는 프레임 간 상관관계가 높은 비디오 기반 기법으로, SSL 훈련에 대해 비계층적 데이터 분포를 보인다. 이 연구에서는 SSL 훈련에서 데이터 세트 중복을 줄이고 SSL 훈련 수렴 및 효율성을 향상시키기 위해 CLE 비디오 시퀀스에 대한 필터 기능을 제안한다. 4개의 최첨단 기본 네트워크와 비전 변환기 작은 백본을 갖춘 SSL 교사-학생 네트워크를 평가에 사용했다. 이러한 네트워크는 부비동 종양 데이터 세트와 피부 편평 세포 암종 데이터 세트에 대한 다운스트림 작업에서 평가되었다. 두 데이터 세트에서 필터링된 SSL 사전 훈련 모델에서 가장 높은 테스트 정확도(각각 67.48% 및 73.52%)를 발견했으며, 이는 비 SSL 기반 네트워크보다 훨씬 우수했다. SSL이 CLE 사전 훈련에 효과적인 방법임을 보여준다. 또한 제안된 CLE 비디오 필터를 사용하여 자기 지도 시나리오에서 훈련 효율성을 향상시켜 훈련 시간을 67% 단축할 수 있음을 보여준다.