CINEMAE는 텍스트 감지 방법의 핵심 원리를 시각적 영역에 적용하여 AI 생성 이미지 감지를 위한 새로운 패러다임을 제시합니다. Masked AutoEncoder (MAE)를 사용하여 가시적 컨텍스트를 기반으로 마스킹된 패치를 재구성하고, 조건부 Negative Log-Likelihood (NLL)를 계산하여 로컬 의미적 이상을 정량화합니다. 이러한 패치 수준 통계를 글로벌 MAE 특징과 통합하여, CINEMAE는 강력한 교차 생성기 일반화를 달성합니다. Stable Diffusion v1.4에서만 훈련되었음에도 불구하고, GenImage 벤치마크에서 8개의 보이지 않는 생성기에 대해 95% 이상의 정확도를 보이며, 최첨단 탐지기보다 훨씬 뛰어난 성능을 보입니다.