본 논문은 생성형 오디오 모델의 발전으로 인해 인간이 작곡한 음악과 생성된 음악을 구분하는 것이 점점 어려워짐에 따라 등장한 가짜 음악 탐지 모델의 견고성을 탐구합니다. 여러 시스템을 사용하여 생성된 실제 및 합성 음악으로 구성된 데이터셋을 구축하고, 다양한 오디오 변환을 적용하여 분류 정확도에 미치는 영향을 분석합니다. 최신 음악 딥페이크 탐지 모델의 성능을 오디오 증강의 존재 하에서 평가하며, 경량의 증강에도 불구하고 모델 성능이 크게 저하됨을 확인합니다.