Exploiting Vulnerabilities in Speech Translation Systems through Targeted Adversarial Attacks
Created by
Haebom
Category
Empty
저자
Chang Liu, Haolin Wu, Xi Yang, Kui Zhang, Cong Wu, Weiming Zhang, Nenghai Yu, Tianwei Zhang, Qing Guo, Jie Zhang
개요
본 논문은 점점 더 널리 사용되는 음성 번역(ST) 시스템의 취약성을 탐구합니다. 연구진은 감지할 수 없는 오디오 조작을 통해 이러한 시스템을 손상시키는 두 가지 방법을 제시합니다. 첫째, 원본 오디오에 섭동을 주입하는 방법이고, 둘째, 표적 번역을 유도하도록 설계된 적대적 음악을 생성하는 방법입니다. 실제 환경에서의 실험을 통해, 신중하게 제작된 오디오 섭동이 번역 모델을 오도하여 표적화된 유해한 출력을 생성할 수 있고, 적대적 음악은 음악의 자연스러운 감지 불가능성을 이용하여 더 은밀하게 이 목표를 달성할 수 있음을 보여줍니다. 이러한 공격은 여러 언어와 번역 모델에서 효과적임을 입증하여 현재 ST 아키텍처의 시스템적 취약성을 강조합니다. 연구 결과는 즉각적인 보안 문제를 넘어 신경 음성 처리 시스템의 해석 가능성과 견고성에 대한 통찰력을 제공합니다.