Sign In

ME: Trigger Element Combination Backdoor Attack on Copyright Infringement

Created by
  • Haebom
Category
Empty

저자

Feiyu Yang, Siyuan Liang, Aishan Liu, Dacheng Tao

개요

생성적 확산 모델(DMs)의 훈련 데이터 복제 능력을 악용하여 저작권 침해 공격을 수행할 수 있으며, 이는 이미지-텍스트 쌍을 오염시키는 방식으로 이루어진다. 본 논문에서는 SilentBadDiffusion (SBD) 기반의 Multi-Element (ME) 공격 방법을 제안하며, 오염된 샘플당 독성 시각-텍스트 요소의 수를 늘려 공격 능력을 향상시키고, 이산 코사인 변환(DCT)을 통해 은밀성을 유지한다. 또한 SBD와 같은 공격 연구를 위한 새로운 데이터 세트를 제시한다. 실험 결과, 새로운 데이터 세트에서 ME 공격은 16.78% / 39.50 및 51.20% / 23.60의 CIR(Copyright Infringement Rate) / FAE(First Attack Epoch) 값을 얻었으며, 낮은 subsampling 비율(5%, 6개의 오염된 샘플) 조건에서도 SBD보다 더 나은 성능을 보였다.

시사점, 한계점

시사점:
SBD 기반의 ME 공격 방법을 통해 저작권 침해 공격 성능을 향상시킴.
새로운 데이터 세트를 제안하여 공격 연구를 위한 자원 제공.
낮은 subsampling 비율에서도 효과적인 공격 수행 가능.
한계점:
SBD의 성능이 아직 이상적이지 않음.
저작권 침해 공격의 잠재적 위험성을 내포함.
👍