Pronunciation Deviation Analysis Through Voice Cloning and Acoustic Comparison
Created by
Haebom
저자
Andrew Valdivia, Yueming Zhang, Hailu Xu, Amir Ghasemkhani, Xin Qin
개요
본 논문은 사용자의 원음과 발음이 교정된 음성 복제본 간의 편차를 분석하여 발음 오류를 감지하는 새로운 방법을 제시합니다. 원음과 복제된 음성 간의 음향적 편차가 최대인 영역이 잠재적인 발음 오류를 나타낸다는 가설을 세우고, 최신 음성 복제 기술을 활용하여 적절한 발음으로 사용자 음성의 합성 버전을 생성한 후 프레임 단위 비교를 통해 문제가 있는 부분을 식별합니다. 실험 결과는 사전 정의된 음운 규칙이나 각 대상 언어에 대한 광범위한 훈련 데이터 없이 특정 발음 오류를 정확히 찾아내는 이 방법의 효과를 보여줍니다.
시사점, 한계점
•
시사점:
◦
사전 정의된 음운 규칙이나 대량의 언어별 훈련 데이터 없이 발음 오류를 감지할 수 있는 새로운 방법 제시.
◦
음성 복제 기술을 활용하여 발음 오류 검출의 정확성과 효율성 향상.
◦
다양한 언어에 대한 적용 가능성.
•
한계점:
◦
음성 복제 기술의 성능에 의존적일 수 있음. (복제된 음성의 질이 결과에 영향을 미칠 수 있음)