Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Time-RA: Hướng tới lý luận chuỗi thời gian cho sự bất thường với phản hồi LLM

Created by
  • Haebom

Tác giả

Yiyuan Yang, Zichuan Liu, Lei Song, Kai Ying, Zhiguang Wang, Tom Bamford, Svitlana Vyetrenko, Jiang Bian, Qingsong Wen

Phác thảo

Bài báo này đề xuất Time-RA (Time-series Reasoning for Anomalies - Lý luận chuỗi thời gian cho các bất thường), một nhiệm vụ mới tận dụng các mô hình ngôn ngữ quy mô lớn (LLM) để chuyển đổi việc phát hiện bất thường chuỗi thời gian thành một nhiệm vụ dựa trên suy luận và sinh sản. Để khắc phục những hạn chế của các phương pháp phát hiện bất thường chuỗi thời gian dựa trên phân loại nhị phân hiện có, chúng tôi giới thiệu bộ dữ liệu chuẩn đa phương thức RATs40K, chứa khoảng 40.000 dữ liệu thực tế. RATs40K bao gồm dữ liệu chuỗi thời gian dạng số, văn bản theo ngữ cảnh và biểu diễn trực quan, mỗi biểu diễn được chú thích với các loại bất thường chi tiết (14 loại đơn biến và 6 loại đa biến) và lý luận giải thích có cấu trúc. Chúng tôi phát triển một khuôn khổ chú thích tinh vi tận dụng các nhãn được tạo ra bởi tập hợp được tinh chỉnh thông qua phản hồi dựa trên GPT-4 để đảm bảo tính chính xác và khả năng diễn giải. Việc đánh giá chuẩn rộng rãi trên LLM và LLM đa phương thức chứng minh khả năng và hạn chế của các mô hình hiện tại và nhấn mạnh tầm quan trọng của việc tinh chỉnh có giám sát. Mã và bộ dữ liệu được cung cấp được cung cấp để hỗ trợ và đẩy nhanh các nghiên cứu trong tương lai.

Takeaways, Limitations

Takeaways:
Chúng tôi đề xuất một phương pháp phát hiện dị thường chuỗi thời gian dựa trên suy luận và tạo ra có thể khắc phục được những hạn chế của phương pháp phát hiện dị thường phân loại nhị phân thông thường.
ĐóNg góp vào nghiên cứu trong tương lai bằng cách cung cấp bộ dữ liệu chuẩn đa phương thức, RATs40K, dựa trên dữ liệu thực tế.
Thu thập dữ liệu chú thích chất lượng cao thông qua khuôn khổ chú thích dựa trên GPT-4.
Thông qua đánh giá hiệu suất của LLM và LLM đa chế độ, chúng tôi phân tích điểm mạnh và điểm yếu của các mô hình và đề xuất tầm quan trọng của việc học có giám sát.
Mở rộng và đẩy nhanh quá trình nghiên cứu thông qua việc phát hành mã nguồn mở và tập dữ liệu.
Limitations:
Kích thước của tập dữ liệu RATs40K có thể yêu cầu các tập dữ liệu lớn hơn và đa dạng hơn trong tương lai.
Cần có thêm nghiên cứu về hiệu suất tổng quát của phương pháp Time-RA được đề xuất.
Khả năng xây dựng một tập dữ liệu thiên về một miền cụ thể và dẫn đến hiệu suất tổng quát kém.
Việc phụ thuộc quá nhiều vào GPT-4 có thể hạn chế khả năng tái tạo nghiên cứu tùy thuộc vào khả năng tiếp cận GPT-4.
👍