Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

HalluSegBench: Counterfactual Visual Reasoning for Segmentation Hallucination Evaluation

Created by
  • Haebom

作者

Xinzhuo Li, Adheesh Juvekar, Xingyou Liu, Muntasir Wahed, Kiet A. Nguyen, Ismini Lourentzou

概要

この論文では、視覚言語分割モデルの幻覚問題を解決するために、反射実績視覚推論の観点から幻覚を評価する新しいベンチマークであるHalluSegBenchを提案します。 HalluSegBenchには、281のユニークなオブジェクトクラスにわたって1340の反射実績インスタンスペアで構成される新しいデータセットと、視覚的に一貫したシーン編集の下でサイケデリック感度を定量化する新しい指標が含まれています。最先端の視覚的言語分割モデルに対するHalluSegBench実験の結果、ラベルベースの幻覚よりも視覚ベースの幻覚がはるかに一般的であり、モデルがしばしば誤った分割に固執する傾向があることを示した。これは、基盤の信頼性を診断するために反射実績推論が必要であることを強調します。

Takeaways、Limitations

Takeaways:
ビジュアル - 言語分割モデルの幻覚問題を解決するための新しいベンチマーク、HalluSegBenchの提示。
反射実績視覚推論により視覚ベースの幻覚を効果的に評価可能
視覚ベースの幻覚がラベルベースの幻覚よりも深刻な問題であることを明らかにします。
モデルの基盤信頼性を向上させるための研究方向を提示する。
Limitations:
HalluSegBenchデータセットの規模が比較的小さい場合があります。
提示された指標がすべての種類の幻覚を完全に捉えることができない可能性があります。
特定の種類の視覚言語分割モデルに偏った結果である可能性があります。
👍