Bài báo này đề xuất CauKer, một thuật toán mới cho việc tiền huấn luyện hiệu quả các mô hình chuỗi thời gian (TSFM) mà không cần tiền huấn luyện tốn kém về mặt tính toán, sử dụng dữ liệu chuỗi thời gian thực quy mô lớn. CauKer kết hợp tổng hợp hạt nhân Quy trình Gauss (GP) với Mô hình Nhân quả Cấu trúc (SCM) để tạo ra dữ liệu chuỗi thời gian tổng hợp đa dạng và nhất quán về mặt nhân quả với các xu hướng thực tế, tính thời vụ và tương tác phi tuyến tính. Nó tạo ra dữ liệu để tiền huấn luyện hiệu quả các TSFM phân loại tiên tiến với kiến trúc và phương pháp tiền huấn luyện đa dạng. Chúng tôi chứng minh bằng thực nghiệm rằng, không giống như các tập dữ liệu thực tế, CauKer thể hiện một quy luật tỷ lệ rõ ràng về cả kích thước tập dữ liệu (từ 10.000 đến 10 triệu mẫu) và dung lượng mô hình (từ 1 triệu đến 783 triệu tham số).