Sign In

AnywhereDoor: Multi-Target Backdoor Attacks on Object Detection

Created by
  • Haebom
Category
Empty

저자

Jialin Lu, Junjie Shan, Ziqi Zhao, Ka-Ho Chow

개요

본 논문은 안전에 중요한 많은 응용 분야에서 필수적인 객체 탐지의 취약성을 이해하는 것이 중요함을 강조합니다. 특히 백도어 공격은 피해 모델에 숨겨진 트리거를 심어 놓아 적대자가 추론 중 악의적인 행동을 유발할 수 있는 심각한 위협이 됩니다. 기존의 연구는 적대자가 훈련 전에 고정된 악의적인 행동(목표)을 정의해야 하는 단일 목표 공격에 국한되어 있어 추론 시간 적응성이 불가능했습니다. 객체 탐지의 큰 출력 공간(객체 존재 예측, 경계 상자 추정 및 분류 포함)을 고려할 때 유연한 추론 시간 모델 제어의 실현 가능성은 아직 탐구되지 않았습니다. 이 논문에서는 객체 탐지를 위한 다중 목표 백도어 공격인 AnywhereDoor를 소개합니다. AnywhereDoor는 일단 심어지면 적대자가 모든 객체 클래스 또는 특정 객체 클래스에서 객체를 사라지게 하거나, 새로운 객체를 만들어내거나, 잘못 분류할 수 있도록 해 전례 없는 수준의 제어를 제공합니다. 이러한 유연성은 세 가지 핵심적인 혁신, 즉 (i) 지원되는 목표의 수를 확장하기 위한 목표 분리, (ii) 영역 기반 검출기에서도 강력성을 보장하기 위한 트리거 모자이크, (iii) 조작을 방해하는 객체 수준의 데이터 불균형을 해결하기 위한 전략적 배치를 통해 가능해집니다. 광범위한 실험을 통해 AnywhereDoor가 공격자에게 높은 수준의 제어 기능을 제공하며, 이러한 유연한 제어를 위한 기존 방법의 적응에 비해 공격 성공률을 26% 향상시킨다는 것을 보여줍니다.

시사점, 한계점

시사점:
객체 탐지 모델에 대한 다중 목표 백도어 공격의 새로운 가능성을 제시합니다.
기존 단일 목표 공격의 한계를 뛰어넘어 추론 시간에 유연한 모델 제어를 가능하게 합니다.
객체의 생성, 삭제, 잘못된 분류 등 다양한 악의적 행위를 수행할 수 있는 높은 수준의 제어 기능을 제공합니다.
트리거 모자이크 및 전략적 배치 기법을 통해 공격의 강건성을 향상시킵니다.
한계점:
AnywhereDoor 공격에 대한 방어 기법에 대한 연구가 추가적으로 필요합니다.
실제 환경에서의 공격 성공률 및 효과에 대한 추가적인 검증이 필요합니다.
특정 객체 클래스에 대한 공격의 효율성이 클래스 간 불균형에 영향을 받을 수 있습니다.
다양한 객체 탐지 모델 및 데이터셋에 대한 일반화 성능 평가가 추가적으로 필요합니다.
👍