AI가 생성한 고품질 오디오의 등장은 허위 정보 캠페인 및 음성 복제 사기와 같은 보안 문제를 야기한다. AI 생성 오디오의 오용에 대한 주요 방어 수단은 워터마킹이며, 워터마크 제거 기술 연구는 워터마크의 강건성을 객관적으로 평가하는 데 중요하다. 기존의 워터마크 제거 방식은 비현실적인 워터마크 지식을 요구하거나 계산 비용이 많이 든다. 본 논문에서는 HarmonicAttack을 소개하며, 이는 대상 워터마크 방식으로부터 워터마크를 생성하는 기본적인 능력만을 요구하는 효율적인 오디오 워터마크 제거 방법이다. HarmonicAttack은 시간 및 주파수 도메인에서 작동하는 이중 경로 컨볼루션 오토인코더와 GAN 스타일 훈련을 사용하여 워터마크를 원본 오디오에서 분리한다. AudioSeal, WavMark, Silentcipher와 같은 최첨단 워터마크 방식에 대해 평가한 결과, HarmonicAttack은 이전 워터마크 제거 방법보다 뛰어난 워터마크 제거 능력을 보이며 거의 실시간 성능을 제공한다. 또한, HarmonicAttack은 훈련이 필요하지만, 분포 외부 샘플에서도 최소한의 성능 저하로 전이가 가능하다.