The Gray Zone of Faithfulness: Taming Ambiguity in Unfaithfulness Detection
Created by
Haebom
作者
Qiang Ding, Lvzhou Luo, Yixuan Cao, Ping Luo
概要
大規模言語モデル(LLM)に元の文書に忠実な要約を生成させることは、実際のアプリケーションに不可欠です。既存のベンチマークは注釈のあいまいさを経験しています。これは、生成された出力で許容可能な外部知識の境界が不明であるためです。この問題を解決するために、外部知識が検証に必要な場合を分類するための中間カテゴリ「Out-Dependent」を導入する新しい忠実度アノテーションフレームワークを提案します。このフレームワークを使用して、要約で不完全さを検出するための新しいベンチマークであるVeriGray(Verification with the Gray Zone)を構築しました。 GPT-5のような最先端のLLMでさえも、要約作業では幻覚現象(文の約6%)を示し、生成された文のかなりの部分(モデル平均約8%)がOut-Dependentカテゴリに属し、不忠実感検出ベンチマークで注釈のあいまいさを解決することが重要であることを強調します。実験は私たちのベンチマークがいくつかの基本的な方法にかなりの困難を提示し、将来の改善の余地があることを示しています。