Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Who Can Withstand Chat-Audio Attacks? An Evaluation Benchmark for Large Audio-Language Models

Created by
  • Haebom

저자

Wanqi Yang, Yanda Li, Meng Fang, Yunchao Wei, Ling Chen

개요

본 논문은 대규모 오디오-언어 모델(LALMs)의 음성 기반 인간-기계 상호작용에서 증가하는 적대적 오디오 공격의 위협을 다룹니다. 기존 연구가 모델 특정 적대적 방법에 초점을 맞춘 반면, 실제 응용 프로그램은 오디오 적대적 공격에 대한 더 일반적이고 보편적인 접근 방식을 요구합니다. 본 논문에서는 대화형 시나리오에서 LALMs의 취약성을 탐구하기 위해 네 가지 유형의 오디오 공격을 포함하는 Chat-Audio Attacks (CAA) 벤치마크를 소개합니다. LALMs의 강력성을 평가하기 위해 세 가지 평가 전략(표준 평가, GPT-4o 기반 평가, 인간 평가)을 제안합니다. Gemini-1.5-Pro, GPT-4o 등 6개의 최첨단 LALMs를 세 가지 평가 방법을 사용하여 CAA 벤치마크에서 평가하고, 네 가지 유형의 오디오 공격이 모델 성능에 미치는 영향을 분석하여 GPT-4o가 가장 높은 수준의 복원력을 보임을 보여줍니다. 데이터는 GitHub에서 공개됩니다.

시사점, 한계점

시사점:
LALMs의 적대적 오디오 공격에 대한 취약성을 폭넓게 평가하는 새로운 벤치마크(CAA)를 제시합니다.
다양한 평가 전략(표준 평가, GPT-4o 기반 평가, 인간 평가)을 통해 LALMs의 강인성을 종합적으로 분석합니다.
GPT-4o가 다른 LALMs보다 적대적 오디오 공격에 대한 높은 복원력을 가짐을 보여줍니다.
공개된 데이터셋을 통해 향후 연구에 기여할 수 있습니다.
한계점:
제시된 벤치마크와 평가 전략이 모든 유형의 적대적 오디오 공격과 LALMs를 포괄하지 못할 수 있습니다.
인간 평가의 주관성이 결과에 영향을 미칠 수 있습니다.
실제 환경에서의 일반화 가능성에 대한 추가 연구가 필요합니다.
👍