Parasite: A Steganography-based Backdoor Attack Framework for Diffusion Models
Created by
Haebom
저자
Jiahao Chen, Yu Pan, Yi Du, Chunkai Wu, Lin Wang
개요
본 논문은 확산 모델 기반 이미지-투-이미지 변환에서의 백도어 공격에 대한 새로운 방법인 "Parasite"를 제안합니다. 기존의 백도어 공격이 단일하고 눈에 띄는 트리거에 의존하여 고정된 목표 이미지를 생성하는 한계를 극복하기 위해, 본 논문에서는 스테가노그래피 기법을 활용하여 트리거를 은닉하고, 목표 콘텐츠 자체를 백도어 트리거로 활용하여 더욱 유연한 공격을 가능하게 합니다. "Parasite"는 기존의 백도어 탐지 프레임워크를 효과적으로 우회하며, 실험 결과 기존 방어 프레임워크에 대한 백도어 탐지율 0%를 달성했습니다. 또한, 다양한 은닉 계수의 영향을 분석하는 실험도 포함하고 있습니다. 코드는 https://anonymous.4open.science/r/Parasite-1715/ 에서 확인할 수 있습니다.
시사점, 한계점
•
시사점:
◦
확산 모델 기반 이미지-투-이미지 변환에서의 백도어 공격에 대한 새로운 위협을 제시합니다.
◦
스테가노그래피 기반의 은닉된 트리거를 활용하여 기존 방어 기법을 우회하는 효과적인 공격 방법을 제시합니다.
◦
목표 콘텐츠 자체를 트리거로 활용하여 더욱 유연하고 은밀한 백도어 공격을 가능하게 합니다.
◦
기존 백도어 공격 방어 시스템의 취약성을 보여줍니다.
•
한계점:
◦
현재 제시된 공격 방법의 일반화 가능성 및 다양한 확산 모델에 대한 적용성에 대한 추가 연구가 필요합니다.