본 논문은 확산 모델을 이용해 생성된 이미지와 실제 이미지 간의 차이점을 이용하여 합성 이미지를 탐지하는 새로운 방법을 제시합니다. 역 다단계 탈잡음 과정을 거친 후 고주파 영역의 푸리에 파워 스펙트럼에서 나타나는 차이점에 기반하여, 이미지에 반복적으로 노이즈를 추가하고 이를 통해 생성된 이미지들을 이용하여 앙상블 분류기를 학습시킵니다. 또한, AI 생성 이미지의 결함을 식별하는 설명 생성 및 개선 모듈을 도입하여 사람의 이해를 돕고, GenHard 및 GenExplain이라는 두 개의 새로운 데이터셋을 구축하여 더욱 어려운 탐지 샘플과 고품질의 근거를 제공합니다. 실험 결과, 제안된 방법은 기존 방법들보다 최소 2.51%~3.46% 향상된 성능을 보이며, 다양한 확산 모델로 생성된 이미지에도 효과적으로 일반화됨을 보여줍니다. 코드와 데이터셋은 공개될 예정입니다.
시사점, 한계점
•
시사점:
◦
확산 모델 기반 합성 이미지 탐지 분야에서 새로운 state-of-the-art 성능 달성 (98.91% 및 95.89% 정확도).
◦
고주파 영역의 푸리에 파워 스펙트럼 분석을 통한 효과적인 합성 이미지 식별.
◦
노이즈 추가 및 앙상블 분류기 학습을 통한 강인한 탐지 성능 구현.
◦
설명 생성 모듈을 통한 AI 생성 이미지 결함의 시각적 이해 증진.
◦
더욱 어려운 샘플과 고품질 근거를 제공하는 새로운 데이터셋 (GenHard, GenExplain) 공개.
◦
다양한 확산 모델에 대한 일반화 성능 우수.
◦
코드 및 데이터셋 공개를 통한 연구 재현성 및 확장성 확보.
•
한계점:
◦
제안된 방법의 성능이 향후 더욱 발전된 합성 이미지 생성 모델에 대해서도 유지될 수 있는지에 대한 추가 연구 필요.