Sign In

An Undetectable Watermark for Generative Image Models

Created by
  • Haebom
Category
Empty

저자

Sam Gunn, Xuandong Zhao, Dawn Song

개요

본 논문은 생성 이미지 모델을 위한 최초의 탐지 불가능한 워터마킹 기법을 제시합니다. 탐지 불가능성은 효율적인 적대자가 여러 번의 적응적 질의를 수행한 후에도 워터마킹된 이미지와 워터마킹되지 않은 이미지를 구별할 수 없음을 보장합니다. 특히, 탐지 불가능한 워터마킹은 효율적으로 계산 가능한 지표 하에서는 이미지 품질을 저하시키지 않습니다. 본 기법은 의사 난수 오류 정정 코드(Christ and Gunn, 2024)를 사용하여 확산 모델의 초기 잠재 변수를 선택하는 방식으로 작동하며, 이는 탐지 불가능성과 강건성을 보장합니다. Stable Diffusion 2.1을 사용하여 워터마킹이 품질을 유지하고 강건함을 실험적으로 입증했습니다. 실험 결과, 기존의 모든 기법과 달리 본 워터마킹은 이미지 품질을 저하시키지 않는다는 것을 확인했습니다. 또한, 기존의 워터마킹 제거 공격은 이미지 품질을 크게 저하시키지 않고서는 워터마킹을 제거하지 못한다는 것을 실험적으로 보여주었습니다. 마지막으로, 워터마킹에 512비트를 강건하게 인코딩할 수 있으며, 워터마킹 제거 공격을 받지 않는 이미지의 경우 최대 2500비트까지 인코딩할 수 있음을 확인했습니다. 코드는 https://github.com/XuandongZhao/PRC-Watermark 에서 이용 가능합니다.

시사점, 한계점

시사점:
생성 이미지 모델에 대한 최초의 탐지 불가능하고 강건한 워터마킹 기법 제시.
이미지 품질 저하 없이 워터마킹 가능.
기존 워터마킹 제거 공격에 대한 강건성 입증.
상당량의 정보(최대 2500비트)를 워터마킹 가능.
한계점:
특정 생성 모델(Stable Diffusion 2.1)에 대한 실험 결과만 제시. 다른 모델에 대한 일반화 가능성은 추가 연구 필요.
워터마킹 제거 공격의 다양성을 더욱 확장하여 검증할 필요가 있음.
워터마킹 용량에 대한 제한(워터마킹 제거 공격 시 512비트).
👍