यह शोधपत्र CauKer का प्रस्ताव करता है, जो बड़े पैमाने पर वास्तविक-विश्व समय श्रृंखला डेटा का उपयोग करके कम्प्यूटेशनल रूप से महंगे पूर्व-प्रशिक्षण की आवश्यकता के बिना समय श्रृंखला-आधारित मॉडल (TSFM) के कुशल पूर्व-प्रशिक्षण के लिए एक नवीन एल्गोरिथम है। CauKer गॉसियन प्रक्रिया (GP) कर्नेल संश्लेषण को संरचनात्मक कारणात्मक मॉडल (SCM) के साथ संयोजित करके यथार्थवादी प्रवृत्तियों, मौसमी और अरैखिक अंतःक्रियाओं के साथ विविध और कारणात्मक रूप से सुसंगत सिंथेटिक समय श्रृंखला डेटा उत्पन्न करता है। यह विविध आर्किटेक्चर और पूर्व-प्रशिक्षण विधियों के साथ अत्याधुनिक वर्गीकरण TSFM के कुशल पूर्व-प्रशिक्षण के लिए डेटा उत्पन्न करता है। हम प्रयोगात्मक रूप से प्रदर्शित करते हैं कि, वास्तविक-विश्व डेटासेट के विपरीत, यह डेटासेट आकार (10,000 से 10 मिलियन नमूने) और मॉडल क्षमता (1 मिलियन से 783 मिलियन पैरामीटर) दोनों के संबंध में एक स्पष्ट स्केलिंग नियम प्रदर्शित करता है।