이 논문은 시각-언어 모델(VLM)이 정답을 맞힐 때 시각 정보에 진정으로 의존하는지를 규명하기 위한 삼층 진단 프레임워크를 제안합니다. 이 프레임워크는 잠재적 이상 탐지, 시각적 필요성 점수, 경쟁 점수라는 세 가지 샘플당 지표를 사용하여 지각, 의존성, 정렬 실패를 분리합니다. 실험 결과, 72.9%의 샘플에서 내부 증거를 보존하면서도 환각된 답변을 디코딩하는 '시각적 아첨(Visual Sycophancy)' 패턴이 나타났으며, 현재의 정렬 훈련으로는 거부(Robust Refusal)가 디코딩 결과로 나타나지 않음을 확인했습니다.