ExDDV: A New Dataset for Explainable Deepfake Detection in Video
Created by
Haebom
Category
Empty
저자
Vlad Hondru, Eduard Hogea, Darian Onchis, Radu Tudor Ionescu
개요
본 논문은 증가하는 심층 합성 영상의 현실성과 품질로 인해 자동 심층 합성 감지기에 대한 의존도가 높아지고 있고, 이 감지기의 오류 가능성과 설명 불가능성으로 인한 문제점을 해결하기 위해 제시되었다. 이를 위해 연구진은 최초의 설명 가능한 심층 합성 영상 감지 데이터셋 및 벤치마크인 ExDDV를 소개한다. ExDDV는 약 5.4K 개의 실제 및 심층 합성 영상으로 구성되며, 인공물을 설명하는 텍스트 설명과 인공물을 지적하는 클릭 정보로 수동 주석이 달려 있다. 다양한 미세 조정 및 컨텍스트 학습 전략을 사용하여 여러 비전-언어 모델을 ExDDV에서 평가한 결과, 심층 합성 영상의 인공물을 찾아내고 설명할 수 있는 강력한 설명 가능 모델을 개발하려면 텍스트 및 클릭 감독이 모두 필요함을 보여준다. 새로운 데이터셋과 결과 재현을 위한 코드는 https://github.com/vladhondru25/ExDDV 에서 이용 가능하다.