본 논문은 음소의 변이체(allophone)를 모델링하는 새로운 접근 방식인 MixGoP를 제안합니다. 기존의 음소 분류기 기반 접근 방식이 다양한 변이체를 단일 음소로 취급하는 단순화를 극복하기 위해, MixGoP는 가우시안 혼합 모델을 이용하여 다중 하위 클러스터를 가진 음소 분포를 모델링합니다. 특히, 동결된 자기 지도 학습 음성 모델(S3M) 특징의 음향 모델링 기능을 활용하며, 실험 결과 네 개의 데이터셋(디스아트리아 및 비원어 음성 포함)에서 최첨단 성능을 달성했습니다. S3M 특징이 MFCC 및 Mel 스펙트로그램보다 음소 변이체를 더 효과적으로 포착한다는 분석 결과도 제시합니다.