Sign In

CIS-BWE: Chaos-Informed Speech Bandwidth Extension

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Tarikul Islam Tamiti, Tonmoy Das, Nursadul Mamun, Anomadarshi Barua

πŸ’‘ κ°œμš”

이 논문은 λŒ€μ—­ν­ μ œν•œμœΌλ‘œ μ†μ‹€λœ 고주파 μŒμ„± 성뢄을 λ³΅μ›ν•˜λŠ” μƒˆλ‘œμš΄ μ λŒ€μ  λŒ€μ—­ν­ ν™•μž₯(BWE) ν”„λ ˆμž„μ›Œν¬μΈ NDSI-BWEλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. NDSI-BWEλŠ” λΉ„μ„ ν˜• 동적 μ‹œμŠ€ν…œμ—μ„œ μ˜κ°μ„ 받은 7κ°€μ§€ μƒˆλ‘œμš΄ νŒλ³„μžλ₯Ό ν™œμš©ν•˜μ—¬ λ‹€μ–‘ν•œ μ‹œκ°„μ  행동을 ν¬μ°©ν•˜κ³ , 이λ₯Ό 톡해 μƒμ„±μžμ˜ ν•™μŠ΅μ„ 효과적으둜 μœ λ„ν•©λ‹ˆλ‹€. μ œμ•ˆλœ 방법둠은 νŒŒλΌλ―Έν„° νš¨μœ¨μ„±μ„ λ‹¬μ„±ν•˜λ©΄μ„œλ„ 객관적 및 주관적 평가 λͺ¨λ‘μ—μ„œ 졜고 μˆ˜μ€€μ˜ μ„±λŠ₯을 λ³΄μ—¬μ€λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μŒμ„± μ‹ ν˜Έμ˜ λ³΅μž‘ν•œ 동적 νŠΉμ„± ν™œμš©: λΉ„μ„ ν˜• 동적 μ‹œμŠ€ν…œμ˜ νŠΉμ„±μ„ ν¬μ°©ν•˜λŠ” νŒλ³„μžλ₯Ό 톡해 κΈ°μ‘΄ BWE λ°©λ²•λ‘ μ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κ³  μŒμ„± μ‹ ν˜Έμ˜ λ³΅μž‘ν•œ μ‹œκ°„μ  νŒ¨ν„΄μ„ 효과적으둜 ν•™μŠ΅ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
효율적인 λͺ¨λΈ μ•„ν‚€ν…μ²˜: Depth-wise convolution을 ν™œμš©ν•œ 각 νŒλ³„μžλŠ” νŒŒλΌλ―Έν„° 수λ₯Ό 8λ°°κΉŒμ§€ 쀄여 νš¨μœ¨μ„±μ„ λ†’μ˜€μŠ΅λ‹ˆλ‹€. ConformerNeXt 기반 μƒμ„±μžλŠ” μ§€μ—­ 및 μ „μ—­ 쒅속성을 효과적으둜 λͺ¨λΈλ§ν•©λ‹ˆλ‹€.
β€’
첨단 μ„±λŠ₯ 달성: 6κ°€μ§€ 객관적 평가 μ§€ν‘œμ™€ 5λͺ…μ˜ 인간 μ‹¬μ‚¬μœ„μ›μ„ ν¬ν•¨ν•œ 주관적 ν‰κ°€μ—μ„œ BWE λΆ„μ•Όμ˜ μƒˆλ‘œμš΄ 졜고 μˆ˜μ€€(SoTA)을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.
πŸ‘