본 논문은 인공지능 생성 콘텐츠(AIGC), 특히 영상 생성 기술의 발전으로 인한 정보 무결성, 신원 보안 및 공공 신뢰 위협 증가에 대한 해결책으로, 사람 중심 위조 영상 탐지를 위한 해석 가능한 MLLM 기반 프레임워크인 AvatarShield를 제안합니다. AvatarShield는 Group Relative Policy Optimization (GRPO)을 통해 고비용 텍스트 주석 데이터 사용을 피하고 정확한 시간 모델링 및 위조 탐지를 가능하게 합니다. 고차원 의미 추론과 저차원 인공물 증폭을 결합한 이중 인코더 아키텍처를 사용하여 MLLM의 효과적인 위조 탐지를 유도하며, 포즈, 오디오 및 텍스트 입력으로 생성된 대규모 사람 중심 영상 벤치마크인 FakeHumanVid 데이터셋을 활용하여 실제 환경에서의 탐지 방법을 엄격하게 평가합니다. 실험 결과, AvatarShield는 기존 접근 방식보다 도메인 내 및 도메인 간 탐지 모두에서 성능이 뛰어나다는 것을 보여줍니다.