본 논문은 인공지능 생성 콘텐츠(AIGC)의 급속한 발전으로 인해 발생하는 콘텐츠 진위성 및 무결성 문제를 해결하기 위해, 이미지와 비디오 모두를 통합적으로 처리하는 설명 가능한 다중 모달 AIGC 탐지 모델인 IVY-XDETECTOR와 대규모 통합 데이터셋 IVY-FAKE를 제안한다. 기존 방법들의 블랙박스 성격과 모달 간 단편적인 접근 방식의 한계를 극복하고자, 15만 개 이상의 풍부하게 주석이 달린 이미지 및 비디오 데이터와 18,700개의 평가 데이터를 제공하며, 단순 이진 분류를 넘어 자연어 추론 기반의 상세한 주석을 포함한다. IVY-XDETECTOR는 이미지와 비디오 콘텐츠에 대한 설명 가능한 탐지를 통합적으로 수행하며, 다양한 벤치마크에서 최첨단 성능을 달성한다. 데이터셋은 https://huggingface.co/datasets/AI-Safeguard/Ivy-Fake 에서 공개적으로 이용 가능하다.