Sign In

Speech Enhancement Based on Drifting Models

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Liang Xu, Diego Caviedes-Nozal, Bastiaan Kleijn, Longfei Felix Yan, Rasmus Kongsgaard Olsson

πŸ’‘ κ°œμš”

λ³Έ 논문은 작음 제거λ₯Ό ν‰ν˜• 문제둜 μž¬μ •μ˜ν•˜λŠ” μƒˆλ‘œμš΄ 생성 λͺ¨λΈ ν”„λ ˆμž„μ›Œν¬μΈ DriftSEλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. DriftSEλŠ” 반볡적인 μƒ˜ν”Œλ§ λŒ€μ‹ , ν•™μŠ΅λœ 보정 벑터인 Drifting Fieldλ₯Ό 톡해 ν‘Έμ‹œλ‹€μš΄ 뢄포λ₯Ό 직접 λ§€ν•‘ν•˜μ—¬ 단일 단계 좔둠을 톡해 작음 제거λ₯Ό λ‹¬μ„±ν•©λ‹ˆλ‹€. 이 방식은 쌍으둜 이루어지지 μ•Šμ€ λ°μ΄ν„°λ‘œλ„ 효과적인 ν•™μŠ΅μ΄ κ°€λŠ₯ν•˜λ©°, κΈ°μ‘΄ 닀단계 ν™•μ‚° λͺ¨λΈμ„ λŠ₯κ°€ν•˜λŠ” κ³ ν’ˆμ§ˆ μŒμ„± ν–₯상 μ„±λŠ₯을 λ³΄μ—¬μ€λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
기쑴의 반볡적인 μƒ˜ν”Œλ§ 방식에 μ˜μ‘΄ν•˜λŠ” ν™•μ‚° λͺ¨λΈκ³Ό 달리, 단일 단계 μΆ”λ‘ λ§ŒμœΌλ‘œλ„ κ³ ν’ˆμ§ˆ μŒμ„± ν–₯상을 달성할 수 μžˆλŠ” μƒˆλ‘œμš΄ κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
쌍으둜 이루어지지 μ•Šμ€ 데이터λ₯Ό ν™œμš©ν•˜μ—¬ λͺ¨λΈμ„ ν•™μŠ΅ν•  수 μžˆμ–΄ 데이터셋 κ΅¬μΆ•μ˜ 뢀담을 쀄이고 λ²”μš©μ„±μ„ 높일 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ ν”„λ ˆμž„μ›Œν¬λŠ” 작음 제거λ₯Ό ν™•λ₯  뢄포 λ§€μΉ­ 문제둜 ν•΄κ²°ν•˜λ©°, μ΄λŠ” μŒμ„± ν–₯상 λΆ„μ•Όμ—μ„œ μƒˆλ‘œμš΄ νŒ¨λŸ¬λ‹€μž„μ„ ꡬ좕할 잠재λ ₯을 μ§€λ‹™λ‹ˆλ‹€.
β€’
μ‹€ν—˜ κ²°κ³ΌλŠ” VoiceBank-DEMAND λ²€μΉ˜λ§ˆν¬μ—μ„œ μš°μˆ˜ν•œ μ„±λŠ₯을 μž…μ¦ν•˜μ§€λ§Œ, λ‹€μ–‘ν•œ μ‹€μ œ ν™˜κ²½μ—μ„œμ˜ μ„±λŠ₯ 검증 및 νŠΉμ • μœ ν˜•μ˜ μž‘μŒμ— λŒ€ν•œ νš¨κ³Όμ„± 심측 뢄석이 ν–₯ν›„ 과제둜 λ‚¨μ•„μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘