Dans cet article, nous proposons HalluSegBench, un nouveau benchmark pour l'évaluation des hallucinations du point de vue du raisonnement visuel contrefactuel, afin de résoudre le problème des hallucinations dans les modèles de segmentation vision-langage. HalluSegBench comprend un nouvel ensemble de données de 1 340 paires d'instances contrefactuelles réparties sur 281 classes d'objets uniques, ainsi qu'un ensemble de nouvelles mesures quantifiant la sensibilité aux hallucinations lors d'un montage de scène visuellement cohérent. Les résultats expérimentaux obtenus avec HalluSegBench, comparés à des modèles de segmentation vision-langage de pointe, montrent que les hallucinations basées sur la vision sont beaucoup plus fréquentes que celles basées sur les étiquettes, et que les modèles ont souvent tendance à effectuer des segmentations incorrectes. Cela souligne la nécessité du raisonnement contrefactuel pour diagnostiquer la fidélité à l'ancrage.