本論文は、既存の自動事実確認(AFC)で使用されている証拠評価方式の制限を指摘し、新しい評価指標であるEv²Rを提示します。既存のアプローチは、予測結果または事前定義された知識ベース(ウィキペディアなど)との正確な一致にのみ依存して証拠の妥当性を評価します。 Ev²Rは、基準ベースの評価と予測結果ベースのスコアを組み合わせて、証拠が参照データとどれだけうまく一致しているか、および予測結果をどれだけ信頼性よく裏付けるかを同時に評価することによって、既存のアプローチの欠点を解決します。実験の結果、Ev²Rは従来の方法よりも精度と堅牢性の点で優れており、特に人間判断との相関関係が高く、敵対的攻撃に対する抵抗力に優れていることを示しました。