본 논문은 비전-언어 모델(VLMs)의 환각(hallucination) 문제 해결을 위한 새로운 방법인 Cross-Temporal Prediction Connection (TPC)를 제시한다. VLMs는 대규모 언어 모델(LLMs)의 성능을 바탕으로 다양한 작업에서 놀라운 발전을 이루었지만, 이미지에 없는 객체나 속성을 자신 있게 묘사하는 환각 문제가 존재한다. 이는 VLMs가 언어적 사전 지식에 의존하는 경향으로 인해 더욱 심화된다. TPC는 시간 경과에 따른 로짓(logits)의 연속성 일관성을 향상시키는 방식으로 로짓 간의 의미적 일관성을 높여 환각을 효과적으로 줄인다. 실험 결과, TPC는 기존 방법보다 정확도와 효율성 면에서 우수한 성능을 보이며, 개방형 텍스트 생성 작업에서도 강건함을 유지하는 것으로 나타났다.