본 논문은 오디오-비주얼 기반의 다중 모달 대규모 언어 모델(MLLMs)의 보안 취약성에 대한 종합적이고 체계적인 검토를 제공합니다. 최근 연구에서 성능 향상을 위해 외부 데이터와 오픈소스 MLLMs를 활용하는 경향이 증가하고 있는데, 이는 심각한 보안 위험을 야기합니다. 본 논문은 적대적 공격, 백도어 공격, 탈옥 공격 등 다양한 유형의 공격을 조사하고, 특히 최신 오디오-비주얼 기반 MLLMs에서의 공격 유형을 검토합니다. 기존 연구들이 특정 공격 유형에만 초점을 맞춘 것과 달리, 본 논문은 다양한 공격 유형을 통합적으로 검토하고, 향후 연구 과제와 동향을 제시합니다.