Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

CauKer: các mô hình nền tảng chuỗi thời gian phân loại chỉ có thể được đào tạo trước trên dữ liệu tổng hợp

Created by
  • Haebom

Tác giả

Shifeng Xie, Vasilii Feofanov, Marius Alonso, Ambroise Odonnat, Jianfeng Zhang, Themis Palpanas, Ievgen Redko

Phác thảo

Bài báo này đề xuất CauKer, một thuật toán mới cho việc tiền huấn luyện hiệu quả các mô hình chuỗi thời gian (TSFM) mà không cần tiền huấn luyện tốn kém về mặt tính toán, sử dụng dữ liệu chuỗi thời gian thực quy mô lớn. CauKer kết hợp tổng hợp hạt nhân Quy trình Gauss (GP) với Mô hình Nhân quả Cấu trúc (SCM) để tạo ra dữ liệu chuỗi thời gian tổng hợp đa dạng và nhất quán về mặt nhân quả với các xu hướng thực tế, tính thời vụ và tương tác phi tuyến tính. Nó tạo ra dữ liệu để tiền huấn luyện hiệu quả các TSFM phân loại tiên tiến với kiến trúc và phương pháp tiền huấn luyện đa dạng. Chúng tôi chứng minh bằng thực nghiệm rằng, không giống như các tập dữ liệu thực tế, CauKer thể hiện một quy luật tỷ lệ rõ ràng về cả kích thước tập dữ liệu (từ 10.000 đến 10 triệu mẫu) và dung lượng mô hình (từ 1 triệu đến 783 triệu tham số).

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một phương pháp đào tạo trước TSFM hiệu quả giúp giảm sự phụ thuộc vào các tập dữ liệu thực tế lớn và giảm chi phí tính toán.
Các tập dữ liệu tổng hợp được tạo thông qua CauKer thể hiện các quy luật tỷ lệ thông thường, cung cấp thông tin chi tiết hữu ích cho việc phát triển mô hình và phân tích hiệu suất.
Chúng tôi trình bày phương pháp tạo dữ liệu tiền đào tạo chung áp dụng cho TSFM với nhiều kiến trúc và phương pháp tiền đào tạo khác nhau.
_____T195033____-:
Dữ liệu tổng hợp do CauKer tạo ra có thể không phản ánh hoàn hảo mọi sự phức tạp của dữ liệu thực.
Các quy luật tỷ lệ được trình bày có thể bị giới hạn trong các môi trường thử nghiệm cụ thể và có thể xuất hiện khác nhau trong các điều kiện khác.
Cần có đánh giá định tính sâu hơn về dữ liệu tổng hợp và phân tích so sánh với dữ liệu thực.
👍