Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Time-RA : Vers un raisonnement en séries chronologiques pour les anomalies avec rétroaction LLM

Created by
  • Haebom

Auteur

Yiyuan Yang, Zichuan Liu, Lei Song, Kai Ying, Zhiguang Wang, Tom Bamford, Svitlana Vyetrenko, Jiang Bian, Qingsong Wen

Contour

Cet article propose le Time-RA (Time-series Reasoning for Anomalies), une nouvelle tâche qui exploite les modèles de langage à grande échelle (LLM) pour transformer la détection d'anomalies de séries chronologiques en une tâche générative et inférentielle. Pour surmonter les limites des méthodes existantes de détection d'anomalies de séries chronologiques basées sur la classification binaire, nous introduisons le jeu de données de référence multimodal RATs40K, qui contient environ 40 000 données réelles. RATs40K est composé de données de séries chronologiques numériques, de texte contextuel et de représentations visuelles, chacune annotée avec des types d'anomalies détaillés (14 univariées et 6 multivariées) et un raisonnement explicatif structuré. Nous développons un cadre d'annotation sophistiqué qui exploite des étiquettes générées par l'ensemble, affinées grâce au feedback basé sur GPT-4, pour garantir la précision et l'interprétabilité. Une analyse comparative approfondie des LLM et des LLM multimodaux démontre les capacités et les limites des modèles actuels et souligne l'importance d'un réglage fin supervisé. Le code et les ensembles de données fournis sont mis à disposition pour soutenir et accélérer les recherches futures.

Takeaways, Limitations

Takeaways:
Nous proposons une approche de détection d'anomalies de séries chronologiques générative et basée sur l'inférence qui surmonte les limites de la détection d'anomalies de classification binaire conventionnelle.
Contribue à la recherche future en fournissant un ensemble de données de référence multimodales, RATs40K, basé sur des données du monde réel.
Obtention de données d'annotation de haute qualité grâce à un cadre d'annotation basé sur GPT-4.
Grâce à l’évaluation des performances du LLM et du LLM multimodal, nous analysons les forces et les faiblesses des modèles et suggérons l’importance de l’apprentissage supervisé.
Développer et accélérer la recherche grâce à des publications de codes open source et de jeux de données.
Limitations:
La taille de l’ensemble de données RATs40K pourrait nécessiter des ensembles de données plus diversifiés et plus volumineux à l’avenir.
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de l’approche Time-RA proposée.
La possibilité de construire un ensemble de données biaisé en faveur d’un domaine spécifique et entraînant de mauvaises performances de généralisation.
Une forte dépendance au GPT-4 peut limiter la reproductibilité de la recherche en fonction de l’accessibilité au GPT-4.
👍