Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Prompt Pirates Need a Map: Stealing Seeds helps Stealing Prompts

Created by
  • Haebom

저자

Felix Machtle, Ashwath Shetty, Jonas Sander, Nils Loose, Soren Pirk, Thomas Eisenbarth

개요

본 논문은 텍스트-이미지 생성 확산 모델에서의 프롬프트 도용 공격에 대한 연구를 다룬다. 기존의 수치적 최적화 기반 프롬프트 복구 방법의 한계점을 지적하며, 이미지 생성 과정에서 사용되는 초기 난수의 중요성을 강조한다. PyTorch의 CPU 상 난수 생성 시 제한된 seed 값(2<sup>32</sup>)으로 인한 취약점(CWE-339)을 이용하여, SeedSnitch라는 도구를 통해 CivitAI 플랫폼의 이미지 약 95%에 대한 seed 값을 140분 이내에 복구할 수 있음을 실험적으로 보여준다. 복구된 seed를 활용하여, 기존 최첨단 방법(PromptStealer, P2HP, CLIP-Interrogator)보다 8-11% 향상된 LPIPS 유사도를 달성하는 유전 알고리즘 기반 프롬프트 도용 방법인 PromptPirate를 제안한다. 마지막으로, seed 도용 및 최적화 기반 프롬프트 도용을 무력화하는 효과적인 대응책을 제시하고, 관련 개발자들과의 협력을 통해 취약점 해결을 위한 노력을 진행했다고 밝힌다.

시사점, 한계점

시사점:
확산 모델 기반 이미지 생성에서 프롬프트 도용의 심각성을 보여줌.
PyTorch의 난수 생성 제한으로 인한 새로운 취약점(CWE-339) 발견 및 활용.
기존 방법보다 성능이 향상된 프롬프트 도용 공격 기법(PromptPirate) 제시.
프롬프트 도용 공격에 대한 효과적인 대응책 제시.
연구 결과를 바탕으로 개발자들과의 협력을 통한 취약점 해결 노력.
한계점:
SeedSnitch의 효율성은 CivitAI 플랫폼의 데이터에 국한될 수 있음.
제안된 대응책의 실제 적용 및 효과에 대한 추가적인 연구 필요.
다른 이미지 생성 플랫폼이나 난수 생성 방법에 대한 취약성 분석 필요.
👍