본 논문은 자율주행 분야에서 환각 현상을 보이는 비전 언어 모델(VLMs)의 문제를 해결하기 위해, 외부 참조나 모델 접근 없이 여러 VLM이 생성한 캡션의 환각 수준을 자동으로 평가하는 새로운 저랭크 접근 방식을 제안한다. 캡션 자체만을 사용하여 문장 임베딩 행렬을 구성하고 이를 저랭크 공통 성분과 희소 잔차로 분해하여 잔차 크기를 기반으로 캡션을 순위를 매긴다. 실험 결과, NuScenes 데이터셋에서 환각이 없는 캡션을 식별하는 데 87%의 정확도를 달성하여 기존 방식 대비 상당한 개선을 보였으며, 추론 시간 또한 대폭 단축했다.