본 논문은 심층 신경망을 활용한 복소 스펙트로그램 처리 기술에 대한 종합적인 개관을 제공합니다. 복소 스펙트로그램이란 크기와 위상 정보를 모두 포함하는 스펙트로그램으로, 본 논문은 다양한 음성 처리 작업을 위한 복소 스펙트로그램과 관련 특징들을 소개하고, 복소수 데이터를 처리하도록 특별히 설계된 복소수 신경망의 주요 구성 요소와 아키텍처를 탐구합니다. 또한 복소 스펙트로그램을 처리하고 모델링하기 위한 신경망 훈련에 맞춤화된 다양한 훈련 전략과 손실 함수를 논의하며, 위상 복원, 음성 향상, 음성 분리 등 심층 학습이 복소 스펙트로그램 또는 파생 특징 표현을 활용하여 상당한 진전을 이룬 주요 응용 분야를 조사합니다. 마지막으로 복소 스펙트로그램과 생성 모델의 교차점을 검토합니다.