Este artículo aborda el problema de alineación de grafos para identificar nodos correspondientes en múltiples grafos. Los métodos existentes basados en aprendizaje no supervisado integran características de nodos en representaciones latentes para realizar comparaciones entre grafos sin correspondencia de verdad fundamental. Sin embargo, presentan una independencia de nodos reducida debido al suavizado excesivo de las incrustaciones basadas en GNN y a la inconsistencia del espacio latente causada por ruido estructural, heterogeneidad de características e inestabilidad del aprendizaje. En este artículo, proponemos un nuevo marco de alineación de grafos que mejora la independencia de nodos y la consistencia geométrica en espacios latentes. Se utiliza un codificador de doble paso que combina filtros espectrales de paso bajo y paso alto para generar incrustaciones con reconocimiento de estructura y alta discriminación dimensional. Se integra un módulo de mapa de características con reconocimiento de geometría para aprender transformaciones biyectivas y equidistantes entre incrustaciones de grafos, asegurando relaciones geométricas consistentes entre diferentes representaciones. Evaluaciones exhaustivas de los puntos de referencia de visión y lenguaje utilizando varios modelos entrenados previamente demuestran que el marco propuesto se generaliza más allá del dominio gráfico, lo que permite la alineación de las representaciones de visión y lenguaje mediante aprendizaje no supervisado.