본 논문은 컴퓨터 보조 발음 훈련(CAPT)에서 발음 숙련도를 여러 측면에서 검토하기 위해 MDD(오류 감지 및 진단)와 APA(자동 발음 평가)를 통합하는 MuFFIN 모델을 제안합니다. MuFFIN은 상호 작용적인 계층적 신경 아키텍처를 활용하여 두 작업을 공동으로 처리하며, 음소 대비 순위 정규화 메커니즘을 통해 음소 구분 특징을 생성하고, MDD의 데이터 불균형 문제를 해결하기 위한 훈련 목표를 설계합니다. Speechocean762 벤치마크 데이터셋에서 최첨단 성능을 입증했습니다.