본 논문은 기존 자동 사실 확인(AFC)에서 사용되는 증거 평가 방식의 한계를 지적하고, 새로운 평가 지표인 Ev²R을 제시합니다. 기존 방식은 예측 결과 또는 사전 정의된 지식 기반(예: 위키피디아)과의 정확한 일치 여부에만 의존하여 증거의 타당성을 평가하는데, 이는 평가 지표의 본래 목적과 지식 기반의 제약으로 인해 한계를 가집니다. Ev²R은 참조 기반 평가와 예측 결과 기반 점수를 결합하여 증거가 참조 자료와 얼마나 잘 일치하는지, 그리고 예측 결과를 얼마나 신뢰성 있게 뒷받침하는지를 동시에 평가함으로써 기존 방식의 단점을 해결합니다. 실험 결과, Ev²R은 기존 방식보다 정확도와 견고성 면에서 우수하며, 특히 인간 판단과의 상관관계가 높고 적대적 공격에 대한 저항력이 뛰어남을 보였습니다.