Este artículo propone SST-iTransformer, una novedosa metodología para predecir la disponibilidad de estacionamiento mediante la integración de las características de la demanda de diversos modos de transporte (metro, autobús, taxis en línea y taxis regulares) para abordar los desafíos del estacionamiento urbano. Utilizamos la agrupación en clústeres de K-medias para definir las zonas de clúster de estacionamiento (ZCP) y mejoramos el iTransformer existente mediante la introducción de un mecanismo de atención de doble rama que incorpora aprendizaje autosupervisado basado en reconstrucción de máscaras, atención de series para capturar dependencias de series temporales y atención de canal para modelar las interacciones entre variables. Los resultados experimentales, utilizando datos reales de Chengdu, China, demuestran que SST-iTransformer supera a los modelos de aprendizaje profundo existentes (Informer, Autoformer, Crossformer e iTransformer), logrando el MSE más bajo y el MAE competitivo. Además, analizamos cuantitativamente la importancia relativa de diversas fuentes de datos, demostrando que los datos de taxis ofrecen la mayor mejora en el rendimiento y confirmando la importancia de modelar las dependencias espaciales.