대규모 언어 모델(LLM) 및 비전 언어 모델(VLM)은 논리적 추론, 문제 해결, 의사 결정 능력을 보여주었지만, 정신 회전, 내비게이션, 공간 관계 이해와 같은 공간 추론은 여전히 중요한 과제이다. 이 논문은 공간 상태의 내부 시뮬레이션인 '상상력'이 공간 세계 모델 내에서 지배적인 추론 메커니즘이라고 가정한다. 이 가설을 검증하고 VLM 공간 추론 메커니즘을 체계적으로 조사하기 위해, 공간 추론 정확도와 추론 효율성을 함께 측정하는 완전 합성 벤치마크인 SpatiaLite를 도입했다.