Cet article propose FoMo, un modèle fondamental applicable à diverses tâches de réseau mobile, telles que le placement de stations de base, l'allocation des ressources et l'optimisation énergétique. FoMo combine un modèle de diffusion et un transformateur pour gérer diverses tâches de prédiction, telles que les prévisions à court et long terme et la production de distribution dans plusieurs villes. Il apprend les caractéristiques uniques de diverses tâches à travers divers masques spatio-temporels et améliore l'apprentissage par transfert en identifiant les corrélations entre le trafic mobile et les environnements urbains grâce à une stratégie d'apprentissage contrastif. Les résultats expérimentaux sur neuf jeux de données réels démontrent que FoMo surpasse les modèles existants pour diverses tâches de prédiction et l'apprentissage à zéro et à quelques coups, démontrant ainsi une forte généralisabilité.