La géolocalisation globale consiste à déterminer la position géographique précise d'images capturées à l'échelle mondiale à l'aide d'indices géographiques tels que le climat, les points de repère et les caractéristiques architecturales. Malgré les progrès des modèles de géolocalisation comme GeoCLIP, leur interprétabilité n'a pas été pleinement explorée. Les méthodes d'interprétabilité conceptuelle existantes ne répondent pas efficacement à l'objectif d'intégrations image-localisation géoalignées, ce qui entraîne une interprétabilité et des performances sous-optimales. Pour combler cette lacune, cet article propose un nouveau cadre intégrant la géolocalisation globale et les goulots d'étranglement conceptuels. La méthode proposée projette conjointement les intégrations image-localisation sur une banque commune de concepts géographiques (par exemple, climat tropical, montagnes, cathédrales) et insère un module d'alignement sensible aux concepts qui minimise les pertes au niveau conceptuel. Cela améliore l'alignement dans les sous-espaces spécifiques aux concepts et permet une interprétabilité robuste. Il s'agit de la première étude à introduire l'interprétabilité dans la géolocalisation. Des expériences approfondies démontrent que l’approche proposée surpasse GeoCLIP en termes de précision de géolocalisation et améliore les performances dans une variété de tâches de prédiction géospatiale, fournissant des informations sémantiques plus riches sur les processus de prise de décision géographique.