Sign In

Enhancing Frequency Forgery Clues for Diffusion-Generated Image Detection

Created by
  • Haebom
Category
Empty

저자

Daichi Zhang, Tong Zhang, Shiming Ge, Sabine Susstrunk

개요

확산 모델은 이미지 생성에서 뛰어난 성과를 거두었지만, 생성된 고품질 이미지는 악의적인 사용에 대한 우려를 낳고 있다. 기존의 탐지기는 다양한 모델과 설정에서 차별적인 단서를 포착하는 데 어려움을 겪어, 보이지 않는 확산 모델에 대한 일반화 및 다양한 방해 요인에 대한 견고성이 제한적이다. 본 논문은 확산 생성 이미지가 저주파수에서 고주파수 대역까지 자연 실제 이미지와 점진적으로 더 큰 차이를 보인다는 점에 착안하여, 모든 주파수 대역에서 주파수 위조 단서(F^2C)를 강화하는 간단하면서 효과적인 표현을 제안한다. 특히, 덜 차별적인 대역을 억제하고 더 유익한 대역을 강화하는 가중 필터 역할을 하는 주파수 선택 함수를 도입한다. 이 접근 방식은 자연 실제 이미지와 확산 생성 이미지 간의 주파수 기반 차이에 대한 포괄적인 분석을 바탕으로, 보이지 않는 확산 모델에서 생성된 이미지를 일반적으로 탐지하고 다양한 방해 요인에 대한 강력한 복원력을 제공한다. 다양한 확산 생성 이미지 데이터 세트에 대한 광범위한 실험을 통해 본 방법이 우수한 일반화 및 견고성으로 최첨단 탐지기를 능가함을 보여준다.

시사점, 한계점

시사점:
확산 모델로 생성된 이미지를 탐지하기 위한 새로운 접근 방식을 제시.
주파수 기반 분석을 통해 일반화 및 견고성이 뛰어난 탐지 기법 개발.
다양한 확산 모델과 방해 요인에 대한 우수한 성능 입증.
한계점:
논문에서 구체적인 한계점에 대한 언급은 없음.
👍