Sign In

Explainable Synthetic Image Detection through Diffusion Timestep Ensembling

Created by
  • Haebom
Category
Empty

저자

Yixin Wu, Feiran Zhang, Tianyuan Shi, Ruicheng Yin, Zhenghua Wang, Zhenliang Gan, Xiaohua Wang, Changze Lv, Xiaoqing Zheng, Xuanjing Huang

개요

본 논문은 확산 모델을 이용해 생성된 이미지와 실제 이미지 간의 차이점을 이용하여 합성 이미지를 탐지하는 새로운 방법을 제시합니다. 역 다단계 탈잡음 과정을 거친 후 고주파 영역의 푸리에 파워 스펙트럼에서 나타나는 차이점에 기반하여, 이미지에 반복적으로 노이즈를 추가하고 이를 통해 생성된 이미지들을 이용하여 앙상블 분류기를 학습시킵니다. 또한, AI 생성 이미지의 결함을 식별하는 설명 생성 및 개선 모듈을 도입하여 사람의 이해를 돕고, GenHard 및 GenExplain이라는 두 개의 새로운 데이터셋을 구축하여 더욱 어려운 탐지 샘플과 고품질의 근거를 제공합니다. 실험 결과, 제안된 방법은 기존 방법들보다 최소 2.51%~3.46% 향상된 성능을 보이며, 다양한 확산 모델로 생성된 이미지에도 효과적으로 일반화됨을 보여줍니다. 코드와 데이터셋은 공개될 예정입니다.

시사점, 한계점

시사점:
확산 모델 기반 합성 이미지 탐지 분야에서 새로운 state-of-the-art 성능 달성 (98.91% 및 95.89% 정확도).
고주파 영역의 푸리에 파워 스펙트럼 분석을 통한 효과적인 합성 이미지 식별.
노이즈 추가 및 앙상블 분류기 학습을 통한 강인한 탐지 성능 구현.
설명 생성 모듈을 통한 AI 생성 이미지 결함의 시각적 이해 증진.
더욱 어려운 샘플과 고품질 근거를 제공하는 새로운 데이터셋 (GenHard, GenExplain) 공개.
다양한 확산 모델에 대한 일반화 성능 우수.
코드 및 데이터셋 공개를 통한 연구 재현성 및 확장성 확보.
한계점:
제안된 방법의 성능이 향후 더욱 발전된 합성 이미지 생성 모델에 대해서도 유지될 수 있는지에 대한 추가 연구 필요.
설명 생성 모듈의 해석 가능성 및 신뢰성에 대한 추가적인 검증 필요.
다양한 유형의 합성 이미지에 대한 일반화 성능 평가 추가 필요.
👍