Sign In

Visual Backdoor Attacks on MLLM Embodied Decision Making via Contrastive Trigger Learning

Created by
  • Haebom
Category
Empty

저자

Qiusi Zhan, Hyeonjeong Ha, Rui Yang, Sirui Xu, Hanyang Chen, Liang-Yan Gui, Yu-Xiong Wang, Huan Zhang, Heng Ji, Daniel Kang

개요

MLLM 기반의 에이전트에서 시각적 백도어 공격의 새로운 공격 표면을 발견하고, 환경 내 객체를 트리거로 사용하는 BEAT 프레임워크를 제시합니다. 이 프레임워크는 다양한 시나리오와 트리거 배치에 대한 훈련 세트 구축, 그리고 SFT와 CTL을 결합한 2단계 훈련 방식을 통해 시각적 백도어 공격 성공률을 최대 80%까지 달성합니다.

시사점, 한계점

MLLM 기반 에이전트의 시각적 백도어 공격 가능성을 처음으로 입증.
객체 기반 트리거의 다양한 변동성을 극복하기 위한 BEAT 프레임워크 제시.
CTL을 통해 백도어 활성화 정확도 향상.
다양한 벤치마크에서 일반화 성능 입증.
제한된 백도어 데이터 환경에서 효과적인 공격 가능성 제시.
MLLM 기반 에이전트의 보안 취약성 문제를 제기하고, 실제 배포 전 방어 체계 구축의 필요성 강조.
논문의 구체적인 방어 메커니즘 제시는 한계점.
👍