Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Time-RA: Hướng tới lý luận chuỗi thời gian cho sự bất thường với phản hồi LLM

Created by
  • Haebom

Tác giả

Yiyuan Yang, Zichuan Liu, Lei Song, Kai Ying, Zhiguang Wang, Tom Bamford, Svitlana Vyetrenko, Jiang Bian, Qingsong Wen

Phác thảo

Để Khắc phục những hạn chế của việc phát hiện dị thường chuỗi thời gian dựa trên phân loại nhị phân thông thường, bài báo này đề xuất Time-RA (Time-series Reasoning for Anomalies), một nhiệm vụ mới dựa trên suy luận và tạo ra cho các dị thường chuỗi thời gian, tận dụng các mô hình ngôn ngữ quy mô lớn (LLM). Chúng tôi trình bày bộ dữ liệu chuẩn đa phương thức RATs40K, bao gồm khoảng 40.000 mẫu dữ liệu thực tế. Mỗi mẫu bao gồm dữ liệu chuỗi thời gian dạng số, văn bản theo ngữ cảnh, biểu diễn trực quan, các loại dị thường chi tiết (14 loại đơn biến và 6 loại đa biến) và lập luận giải thích có cấu trúc. Độ chính xác và khả năng diễn giải được đảm bảo thông qua một khuôn khổ chú thích tinh vi dựa trên GPT-4. Việc chuẩn hóa rộng rãi các LLM và LLM đa phương thức chứng minh hiệu suất và những hạn chế của các mô hình hiện tại, nhấn mạnh tầm quan trọng của việc tinh chỉnh dựa trên học có giám sát. Bộ dữ liệu và mã được công khai để hỗ trợ các nghiên cứu trong tương lai.

Takeaways, Limitations

Takeaways:
Chúng tôi đề xuất một tác vụ Time-RA mới vượt ra ngoài phạm vi phát hiện dị thường phân loại nhị phân truyền thống và cho phép phân loại chi tiết và suy luận giải thích cho các dị thường.
RATs40K, một tập dữ liệu chuẩn phát hiện dị thường theo chuỗi thời gian đa phương thức (số, văn bản, hình ảnh) dựa trên dữ liệu thực tế, đã được phát hành.
Xây dựng các tập dữ liệu chất lượng cao với khuôn khổ chú thích phức tạp dựa trên GPT-4.
Đề Xuất các hướng nghiên cứu trong tương lai thông qua đánh giá hiệu suất của LLM và LLM đa phương thức.
Cho phép nghiên cứu thông qua mã mở và tập dữ liệu.
Limitations:
Có thể còn thiếu phân tích chi tiết về hiệu suất và hạn chế của mô hình hiện tại.
Cần xác nhận thêm hiệu suất tổng quát hóa trên tập dữ liệu RATs40K.
Cần có thêm nghiên cứu về khả năng áp dụng của nó vào nhiều loại dữ liệu chuỗi thời gian khác nhau.
👍