Cet article propose CauKer, un nouvel algorithme permettant un pré-apprentissage efficace des modèles basés sur des séries chronologiques (TSFM) sans nécessiter de pré-apprentissage coûteux en calcul, à partir de données de séries chronologiques réelles à grande échelle. CauKer combine la synthèse du noyau du processus gaussien (GP) avec des modèles causaux structurels (SCM) pour générer des données de séries chronologiques synthétiques diverses et causalement cohérentes, présentant des tendances, une saisonnalité et des interactions non linéaires réalistes. Il génère des données pour un pré-apprentissage efficace des TSFM de classification de pointe, avec diverses architectures et méthodes de pré-apprentissage. Nous démontrons expérimentalement que, contrairement aux ensembles de données réels, il présente une loi d'échelle claire concernant la taille de l'ensemble de données (10 000 à 10 millions d'échantillons) et la capacité du modèle (1 million à 783 millions de paramètres).