A Survey of Deep Learning for Complex Speech Spectrograms
Created by
Haebom
저자
Yuying Xie, Zheng-Hua Tan
개요
본 논문은 딥러닝 기반 복소 스펙트로그램 처리에 대한 최신 기술을 포괄적으로 개괄한다. 복소 스펙트로그램의 소개, 복소수 신경망 및 실수 신경망 기반 처리 방법, 훈련 전략 및 손실 함수, 주요 응용 분야(위상 복원, 음성 향상, 화자 분리), 생성 모델과의 연관성을 다룬다. 이 논문은 음성 신호 처리, 딥러닝 관련 연구자 및 실무자에게 유용한 정보를 제공하는 것을 목표로 한다.
시사점, 한계점
•
시사점:
◦
딥러닝을 활용한 복소 스펙트로그램 처리에 대한 최신 기술들을 체계적으로 정리하여 연구 동향을 파악할 수 있게 한다.
◦
복소수 신경망과 실수 신경망 기반 처리 방법, 훈련 전략, 응용 분야를 폭넓게 다루어 관련 연구에 대한 이해를 높인다.