Cluster-PFN은 Prior-Data Fitted Networks (PFNs)를 확장하여 비지도 Bayesian 클러스터링을 수행하는 Transformer 기반 모델입니다. 유한 혼합 가우시안 모델(GMM) 사전 분포에서 생성된 합성 데이터셋으로 훈련되어 클러스터 수와 클러스터 할당에 대한 사후 분포를 추정합니다. AIC, BIC, Variational Inference (VI)와 같은 수작업 모델 선택 절차보다 클러스터 수를 더 정확하게 추정하며, VI와 경쟁하는 클러스터링 품질을 유지하면서도 속도는 수십 배 빠릅니다. 또한, 결측 데이터가 포함된 복잡한 사전 분포에서도 훈련 가능하며, 실제 유전체 데이터셋에서 imputation 기반 baseline보다 우수한 성능을 보입니다.