Để Khắc phục những hạn chế của việc phát hiện dị thường chuỗi thời gian dựa trên phân loại nhị phân thông thường, bài báo này đề xuất Time-RA (Time-series Reasoning for Anomalies), một nhiệm vụ mới dựa trên suy luận và tạo ra cho các dị thường chuỗi thời gian, tận dụng các mô hình ngôn ngữ quy mô lớn (LLM). Chúng tôi trình bày bộ dữ liệu chuẩn đa phương thức RATs40K, bao gồm khoảng 40.000 mẫu dữ liệu thực tế. Mỗi mẫu bao gồm dữ liệu chuỗi thời gian dạng số, văn bản theo ngữ cảnh, biểu diễn trực quan, các loại dị thường chi tiết (14 loại đơn biến và 6 loại đa biến) và lập luận giải thích có cấu trúc. Độ chính xác và khả năng diễn giải được đảm bảo thông qua một khuôn khổ chú thích tinh vi dựa trên GPT-4. Việc chuẩn hóa rộng rãi các LLM và LLM đa phương thức chứng minh hiệu suất và những hạn chế của các mô hình hiện tại, nhấn mạnh tầm quan trọng của việc tinh chỉnh dựa trên học có giám sát. Bộ dữ liệu và mã được công khai để hỗ trợ các nghiên cứu trong tương lai.