본 논문은 음성 인증 시스템(VAS)의 심각한 취약성을 보여주는 새로운 공격 기법인 Spectral Masking and Interpolation Attack (SMIA)을 제안합니다. SMIA는 인간의 귀에는 들리지 않는 주파수 영역을 전략적으로 조작하여 AI 생성 음성을 변조함으로써, 기존의 안티 스푸핑 대응책(CMs)을 우회하는 적대적 샘플을 생성합니다. 실제 환경을 모방한 다양한 실험을 통해 최첨단(SOTA) 모델에 대한 SMIA의 효과를 평가한 결과, 결합된 VAS/CM 시스템에 대해 최소 82%, 독립적인 화자 인증 시스템에 대해 최소 97.5%, 그리고 대응책에 대해서는 100%의 높은 공격 성공률을 달성했습니다. 이는 현재의 보안 체계가 적응적인 적대적 공격에 대해 불충분함을 보여줍니다.