본 논문은 딥러닝 기반 오디오 워터마킹 방법을 표준화되고 체계적인 비교를 통해 평가하기 위한 벤치마크인 강력한 오디오 워터마킹 벤치마크(RAW-Bench)를 소개합니다. 실제 사용 환경을 시뮬레이션하기 위해 압축, 배경 잡음, 반향과 같은 다양한 왜곡을 포함하는 포괄적인 오디오 공격 파이프라인과 음성, 환경 소음, 음악 녹음을 포함하는 다양한 테스트 데이터 세트를 도입했습니다. RAW-bench에서 기존의 네 가지 워터마킹 방법을 평가한 결과, 두 가지 주요 통찰력을 얻었습니다. (i) 신경망 압축 기술은 알고리즘이 이러한 압축으로 훈련되더라도 가장 큰 과제를 제기합니다. (ii) 오디오 공격으로 훈련하면 일반적으로 강건성이 향상되지만, 경우에 따라서는 불충분합니다. 또한, 극성 반전, 시간 스트레칭 또는 반향과 같은 특정 왜곡은 특정 방법에 심각한 영향을 미치는 것을 발견했습니다. 평가 프레임워크는 github.com/SonyResearch/raw_bench에서 이용할 수 있습니다.