Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

PATH : un ensemble de données à séquences discrètes pour l'évaluation des approches de détection d'anomalies en ligne non supervisées pour les séries chronologiques multivariées

Created by
  • Haebom

Auteur

Lucas Correia, Jan-Christoph Goos, Thomas Back, Anna V. Kononova

Contour

Afin de relever les défis de la recherche sur la détection d'anomalies dans les séries chronologiques multivariées, cet article propose un nouvel ensemble de données contenant des anomalies diverses, étendues et non triviales reflétant le comportement réaliste des groupes motopropulseurs automobiles. Cet ensemble de données, généré à l'aide d'outils de simulation de pointe, répond aux défis des ensembles de données publics existants, notamment leur taille, leur diversité et leur complexité. Il présente des caractéristiques multivariées, dynamiques et d'état variable, et aborde des problèmes de séquences discrètes non abordés dans les recherches précédentes. Pour soutenir les configurations de détection d'anomalies supervisées et semi-supervisées, la génération de séries chronologiques et la prévision, nous fournissons plusieurs versions de l'ensemble de données, composées de données contaminées et propres. Nous présentons également des résultats de performance de base basés sur des autoencodeurs déterministes et variationnels, ainsi que sur des approches non paramétriques. Nos résultats expérimentaux de base démontrent que les modèles entraînés sur l'ensemble de données semi-supervisées surpassent les modèles supervisés, soulignant la nécessité d'approches plus robustes pour les données d'entraînement contaminées. De plus, nous soulignons l’impact significatif du seuillage sur les performances de détection, soulignant la nécessité de recherches supplémentaires pour trouver des seuils appropriés pour les données non étiquetées.

Takeaways, Limitations

Takeaways:
Fournir un ensemble de données de haute qualité pour la recherche sur la détection d'anomalies de séries chronologiques multivariées dans le domaine des groupes motopropulseurs automobiles.
ÉLargir le domaine de recherche en fournissant un nouvel ensemble de données incluant des problèmes de séquences discrètes.
Prend en charge les paramètres d'apprentissage supervisés et semi-supervisés
Souligne l’importance d’une approche robuste des données de formation contaminées.
L’importance de la définition de seuils et la nécessité de recherches sur des méthodes automatisées de définition de seuils sont présentées.
Limitations:
L’ensemble de données proposé peut ne pas correspondre parfaitement aux données réelles sur le terrain.
Absence de méthodologie automatisée pour la définition des seuils.
Portée limitée des algorithmes utilisés dans les expériences de base
👍