본 논문은 비전-언어(VL) 모델에서 발생하는 환각 현상을 다룬다. 기존의 개념적 반사실적 설명 기법을 활용하여 널리 사용되는 이미지 캡셔닝 모델의 환각 현상을 분석한다. 제안된 HalCECE 프레임워크는 계층적 지식에 기반한 의미론적으로 최소한의 수정을 제시하여 환각 캡션을 비환각 캡션으로 전환하며, 단순 숫자가 아닌 의미있는 수정을 제공하여 해석성을 높인다. 특히, 시각적 개념 간의 상호연결성을 고려한 역할 환각(role hallucinations) 분석을 시도하는 등 VL 환각 검출 분야에 대한 설명 가능한 방향을 제시한다.