Visual Language Model(VLM)의 지오로케이션(geo-localization) 문제 해결을 위해, GRE(Geo Reason Enhancement) Suite를 제안합니다. GRE는 구조화된 추론 체인을 활용하여 정확하고 해석 가능한 위치 추론을 수행합니다. GRE는 데이터셋(GRE30K), 모델(GRE model), 벤치마크(GREval-Bench)의 세 가지 차원으로 구성됩니다. GRE30K 데이터셋은 세밀한 시각적, 맥락적 분석을 지원하며, GRE 모델은 다단계 추론 전략을 사용하여 장면 속성, 세부 정보 및 의미적 특징을 점진적으로 추론합니다. GREval-Bench는 다양한 장면에서 VLM의 성능을 평가합니다. 실험 결과는 GRE가 기존 방법들을 능가함을 보여줍니다.