Để Giải quyết những thách thức của nghiên cứu phát hiện dị thường chuỗi thời gian đa biến, bài báo này đề xuất một tập dữ liệu mới chứa các dị thường đa dạng, toàn diện và không tầm thường, phản ánh hành vi thực tế của hệ thống truyền động ô tô. Tập dữ liệu này, được tạo ra bằng các công cụ mô phỏng tiên tiến, giải quyết những thách thức của các tập dữ liệu công khai hiện có, bao gồm quy mô, tính đa dạng và độ phức tạp của dị thường chưa đủ. Tập dữ liệu này có các đặc điểm trạng thái đa biến, động và biến đổi, đồng thời giải quyết các vấn đề chuỗi rời rạc chưa được đề cập trong các nghiên cứu trước đây. Để hỗ trợ thiết lập phát hiện dị thường có giám sát và bán giám sát, tạo chuỗi thời gian và dự báo, chúng tôi cung cấp nhiều phiên bản tập dữ liệu, bao gồm dữ liệu bị ô nhiễm và dữ liệu sạch. Chúng tôi cũng trình bày kết quả hiệu suất cơ sở dựa trên bộ mã hóa tự động xác định và biến phân, cũng như các phương pháp phi tham số. Kết quả thử nghiệm cơ sở của chúng tôi chứng minh rằng các mô hình được huấn luyện trên tập dữ liệu bán giám sát hoạt động tốt hơn các mô hình có giám sát, nhấn mạnh nhu cầu về các phương pháp tiếp cận mạnh mẽ hơn đối với dữ liệu huấn luyện bị ô nhiễm. Hơn nữa, chúng tôi nhấn mạnh tác động đáng kể của ngưỡng đối với hiệu suất phát hiện, nhấn mạnh nhu cầu nghiên cứu sâu hơn để tìm ngưỡng thích hợp cho dữ liệu chưa được gắn nhãn.