Este artículo propone FoMo, un modelo fundamental aplicable a diversas tareas de redes móviles, como la ubicación de estaciones base, la asignación de recursos y la optimización energética. FoMo combina un modelo de difusión y un transformador para gestionar diversas tareas de predicción, como predicciones a corto y largo plazo y la generación de distribución en múltiples ciudades. Aprende las características únicas de diversas tareas mediante diversas máscaras espaciotemporales y mejora el aprendizaje por transferencia al identificar correlaciones entre el tráfico móvil y los entornos urbanos mediante una estrategia de aprendizaje contrastivo. Los resultados experimentales en nueve conjuntos de datos reales demuestran que FoMo supera a los modelos existentes en diversas tareas de predicción y aprendizaje de cero y pocos disparos, demostrando una gran generalización.