DP-TRAE: A Dual-Phase Merging Transferable Reversible Adversarial Example for Image Privacy Protection
Created by
Haebom
저자
Xia Du, Jiajie Zhu, Jizhe Zhou, Chi-man Pun, Zheng Lin, Cong Wu, Zhe Chen, Jun Luo
개요
본 논문은 디지털 보안 분야에서 가역적 적대적 예시(RAE)를 이용하여 민감한 데이터를 보호하고 악의적인 심층 신경망(DNN)의 무단 분석을 방지하는 방법을 제시한다. 기존 RAE 기법들은 주로 화이트박스 공격에 초점을 맞춰 블랙박스 환경에서의 효과에 대한 평가가 부족하다는 한계점을 지닌다. 이러한 한계를 해결하기 위해, 본 논문에서는 화이트박스 모델에서 고도로 전이 가능한 초기 적대적 섭동을 생성하고 메모리 증강 블랙박스 전략을 사용하여 타겟 모델을 효과적으로 오도하는 이중 단계 병합 전이 가능 가역 공격(Dual-Phase Merging Transferable Reversible Attack) 방법을 제안한다. 실험 결과, 블랙박스 시나리오에서 99.0%의 공격 성공률과 100%의 복구율을 달성하여 프라이버시 보호의 강력함을 보여준다. 또한, 상용 모델에 대한 블랙박스 공격을 성공적으로 구현하여 실제 적용 가능성을 입증하였다.