확산 모델의 생성 능력과 사전 훈련된 비전 트랜스포머 특징을 결합하여 강력하고 정확한 클러스터링을 달성하는 자기 지도 학습 프레임워크인 CLUDI(Clustering via Diffusion)를 소개합니다. CLUDI는 교사-학생 패러다임을 통해 훈련됩니다. 교사는 확산 기반 확률적 샘플링을 사용하여 다양한 클러스터 할당을 생성하고, 학생은 이를 안정적인 예측으로 개선합니다. 이러한 확률성은 새로운 데이터 증강 전략으로 작용하여 고차원 데이터의 복잡한 구조를 발견할 수 있도록 합니다. 다양한 데이터셋에 대한 광범위한 평가 결과, CLUDI는 비지도 분류에서 최첨단 성능을 달성하여 클러스터링 강력성과 복잡한 데이터 분포에 대한 적응성에서 새로운 기준을 제시합니다.