TruthLens는 기존의 이진 분류 방식(진짜 vs. 가짜)의 한계를 넘어, 이미지가 진짜인지 가짜인지 판별하고 그 예측에 대한 상세한 텍스트 기반 추론을 제공하는 새로운 DeepFake 탐지 프레임워크입니다. PaliGemma2와 같은 다중 모달 대규모 언어 모델의 전역적 문맥 이해 능력과 DINOv2와 같은 비전 전용 모델의 국소적 특징 추출 능력을 결합한 하이브리드 설계를 통해 얼굴 조작 DeepFake와 AI 생성 콘텐츠 모두를 효과적으로 처리합니다. 눈, 코, 입 등 세부적인 부분에 대한 질문에도 답할 수 있으며, 다양한 데이터셋에서 기존 최첨단 방법보다 2~14% 향상된 탐지 정확도와 설명 가능성을 보였습니다. 기존 및 새로운 조작 기법에 효과적으로 일반화됩니다.