Cet article propose SST-iTransformer, une nouvelle méthodologie de prédiction de la disponibilité du stationnement intégrant les caractéristiques de la demande de différents modes de transport (métro, bus, réservation de taxis en ligne et taxis classiques) afin de relever les défis du stationnement urbain. Nous utilisons le clustering K-means pour définir les zones de regroupement de stationnement (PCZ) et améliorons l'iTransformer existant en introduisant un mécanisme d'attention à double branche qui intègre l'apprentissage auto-supervisé basé sur la reconstruction de masque, l'attention sérielle pour capturer les dépendances temporelles et l'attention canalisée pour modéliser les interactions entre les variables. Les résultats expérimentaux utilisant des données réelles de Chengdu, en Chine, démontrent que SST-iTransformer surpasse les modèles d'apprentissage profond existants (Informer, Autoformer, Crossformer et iTransformer), atteignant l'erreur quadratique moyenne la plus faible et l'erreur quadratique moyenne la plus compétitive. De plus, nous analysons quantitativement l'importance relative de diverses sources de données, démontrant que les données de réservation de taxis offrent la plus grande amélioration des performances et confirmant l'importance de la modélisation des dépendances spatiales.