D\'er\'everb\'eration non-supervis\'ee de la parole par mod\`ele hybride
Created by
Haebom
저자
Louis Bahrman (IDS, S2A), Mathieu Fontaine (IDS, S2A), Gael Richard (IDS, S2A)
개요
본 논문은 잔향음만 사용하여 비지도 방식으로 음성 잔향 제거 시스템을 개선하는 새로운 훈련 전략을 소개합니다. 기존 알고리즘은 건조/잔향 음성 쌍 데이터를 사용하지만, 이는 얻기 어렵습니다. 본 연구는 잔향 시간 (RT60)과 같은 제한적인 음향 정보를 활용하여 잔향 제거 시스템을 훈련합니다. 실험 결과, 제안하는 방법이 다양한 객관적 지표에서 최첨단 기술보다 더 일관된 성능을 달성했습니다.
시사점, 한계점
•
시사점:
◦
건조 음성 데이터 없이 잔향 제거 시스템을 훈련할 수 있는 새로운 비지도 학습 방법 제시.