La geolocalización global implica determinar la ubicación geográfica precisa de imágenes capturadas globalmente mediante indicadores geográficos como el clima, los puntos de referencia y las características arquitectónicas. A pesar de los avances en modelos de geolocalización como GeoCLIP, su interpretabilidad no se ha explorado a fondo. Los métodos de interpretabilidad basados en conceptos existentes no se alinean eficazmente con el objetivo de incrustaciones geoalineadas de imagen a ubicación, lo que resulta en una interpretabilidad y un rendimiento deficientes. Para abordar esta deficiencia, este artículo propone un nuevo marco que integra la geolocalización global y los cuellos de botella conceptuales. El método propuesto proyecta conjuntamente incrustaciones de imagen y ubicación en un banco compartido de conceptos geográficos (p. ej., clima tropical, montañas, catedrales) e inserta un módulo de alineación que reconoce los conceptos y minimiza la pérdida a nivel de concepto. Esto mejora la alineación en subespacios específicos de cada concepto y permite una interpretabilidad robusta. Este es el primer estudio que introduce la interpretabilidad en la geolocalización. Amplios experimentos demuestran que el enfoque propuesto supera a GeoCLIP en precisión de geolocalización y mejora el rendimiento en una variedad de tareas de predicción geoespacial, proporcionando información semántica más rica sobre los procesos de toma de decisiones geográficas.