MIRAGE는 물체 속성 인식, 공간 관계 추론, 그리고 동적 추론을 포함하는 인간 인지의 핵심 요소인 공간 지각 및 추론 능력을 평가하기 위한 다중 모드 벤치마크입니다. 기존 벤치마크의 한계를 극복하기 위해, MIRAGE는 Counting(물체 속성 인식), Relation(공간 관계 추론), 그리고 Counting with Relation이라는 세 가지 과제를 통해 모델의 능력을 평가합니다. 다양하고 복잡한 시나리오를 통해 최첨단 모델의 한계를 보여주며, 향상된 표현과 추론 프레임워크의 필요성을 강조합니다. 궁극적으로 MIRAGE는 미래 연구에서 시공간 추론으로 나아갈 수 있는 길을 제시합니다.