Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

CAHS-Attack: CLIP-Aware Heuristic Search Attack Method for Stable Diffusion

Created by
  • Haebom
Category
Empty

저자

Shuhan Xia, Jing Dai, Hui Ouyang, Yadong Shang, Dongxiao Zhao, Peipei Li

개요

Diffusion 모델은 적대적 프롬프트에 취약하며, 이러한 취약점을 파악하고 견고한 생성 시스템을 구축하려면 공격 능력을 강화하는 것이 중요합니다. 이 논문에서는 CLIP-Aware Heuristic Search attack method인 CAHS-Attack을 제안합니다. CAHS-Attack은 몬테 카를로 트리 탐색(MCTS)을 통합하여 미세 조정된 접미사 최적화를 수행하고, 제한된 유전 알고리즘을 활용하여 잠재력이 높은 적대적 프롬프트를 루트 노드로 사전 선택하며, 효율적인 로컬 검색을 위해 각 시뮬레이션 롤아웃에서 가장 의미적으로 파괴적인 결과를 유지합니다. 광범위한 실험을 통해 제안된 방법이 다양한 의미를 가진 짧고 긴 프롬프트 모두에서 최첨단 공격 성능을 달성함을 보여줍니다. 또한 SD 모델의 취약성은 CLIP 기반 텍스트 인코더의 내재된 취약성에 기인하며, 이는 현재 텍스트-이미지 파이프라인에 근본적인 보안 위험을 시사합니다.

시사점, 한계점

시사점:
CAHS-Attack은 기존 방법에 비해 향상된 공격 성능을 보입니다.
SD 모델의 취약성은 CLIP 기반 텍스트 인코더의 취약성에 기인합니다.
현재 텍스트-이미지 파이프라인의 보안 위험을 제시합니다.
한계점:
논문 자체에서 명시된 한계점은 제시되지 않았습니다.
👍