OpenSDI: Spotting Diffusion-Generated Images in the Open World
Created by
Haebom
Category
Empty
저자
Yabin Wang, Zhiwu Huang, Xiaopeng Hong
개요
본 논문은 개방형 환경에서 확산 모델로 생성된 이미지를 식별하는 과제인 OpenSDI를 제시하고, 이를 해결하기 위한 새로운 벤치마크 데이터셋인 OpenSDID를 소개합니다. OpenSDID는 다양한 거대 비전-언어 모델을 활용하여 개방형 환경의 확산 기반 조작을 시뮬레이션하고, 전역 및 지역적 조작 이미지에 대한 탐지 및 위치 확인 작업을 모두 포함하는 것이 특징입니다. OpenSDI 과제에 대응하여, 본 논문은 사전 훈련된 여러 기반 모델을 결합하는 Synergizing Pretrained Models (SPM) 기법을 제안합니다. SPM 기반 모델인 MaskCLIP은 CLIP과 MAE를 통합하여 개방형 환경에서의 일반화 성능을 향상시킵니다. OpenSDID에 대한 광범위한 평가 결과, MaskCLIP은 기존 최첨단 방법보다 탐지 및 위치 확인 작업에서 상당한 성능 향상을 보였습니다 (IoU 14.23%, F1 14.11%, 정확도 2.05%, F1 2.38% 향상). 데이터셋과 코드는 https://github.com/iamwangyabin/OpenSDI 에서 공개됩니다.