본 논문은 음성 인증 시스템(VAS)과 안티 스푸핑 대응책(CMs)을 표적으로 하는 최신 위협 환경에 대한 종합적인 검토를 제시합니다. 수작업 음향 특징에 의존하는 기존 시스템에서 강력한 화자 임베딩을 추출할 수 있는 심층 학습 모델로의 음성 인증의 중요한 변화를 추적하며, 데이터 포이즈닝, 적대적 공격, 딥페이크, 적대적 스푸핑 공격을 포함한 다양한 공격 유형을 다룹니다. 각 공격 유형에 대해 방법론을 요약하고, 일반적으로 사용되는 데이터셋을 강조하며, 성능과 한계를 비교하고, 널리 받아들여지는 분류 체계를 사용하여 기존 문헌을 정리합니다. 새롭게 등장하는 위험과 미해결 과제를 강조하여 더욱 안전하고 탄력적인 음성 인증 시스템 개발을 지원하는 것을 목표로 합니다.