본 논문은 익명화된 음성에서 화자를 식별하는 적대적 모델인 SpecWav-Attack을 제시합니다. Wav2Vec2를 특징 추출에 활용하고, 성능 향상을 위해 스펙트로그램 크기 조정 및 증분 학습을 통합합니다. librispeech-dev 및 librispeech-test 데이터셋에서 평가한 결과, SpecWav-Attack은 기존 공격보다 우수한 성능을 보이며, 익명화된 음성 시스템의 취약성을 드러내고 더 강력한 방어의 필요성을 강조합니다. ICASSP 2025 Attacker Challenge를 기준으로 벤치마킹되었습니다.