Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Score des valeurs aberrantes basé sur l'histogramme étendu (EHBOS)

Created by
  • Haebom

Auteur

Tanvir Islam

Contour

Le score aberrant basé sur l'histogramme (HBOS) est une méthode de détection des valeurs aberrantes largement utilisée en raison de son efficacité et de sa simplicité de calcul. Cependant, comme il suppose l'indépendance entre les caractéristiques, sa capacité à détecter les valeurs aberrantes dans les jeux de données où les interactions entre caractéristiques sont significatives est limitée. Dans cet article, nous proposons le score aberrant basé sur l'histogramme étendu (EHBOS), une amélioration du HBOS qui intègre des histogrammes bidimensionnels pour capturer les dépendances entre paires de caractéristiques. Cette extension permet à l'EHBOS d'identifier les anomalies contextuelles et de dépendance que le HBOS ne parvient pas à détecter. À l'aide de 17 jeux de données de référence, nous évaluons l'efficacité et la robustesse de l'EHBOS dans divers scénarios de détection d'anomalies. L'EHBOS surpasse le HBOS sur plusieurs jeux de données où les interactions entre caractéristiques sont cruciales pour définir la structure de l'anomalie, permettant des améliorations significatives de l'AUC ROC. Ces résultats démontrent qu'EHBOS peut être une extension précieuse du HBOS pour la modélisation de dépendances complexes entre caractéristiques. En particulier dans les ensembles de données où les anomalies contextuelles ou relationnelles jouent un rôle important, EHBOS fournit un nouvel outil puissant de détection d'anomalies.

Takeaways, Limitations

Takeaways:
Nous proposons un algorithme EHBOS qui surmonte les limitations du HBOS existant en prenant en compte l'interdépendance entre les fonctionnalités.
Vérification expérimentale de l'efficacité et de la robustesse de l'EHBOS dans divers scénarios de détection d'anomalies.
Nous avons observé une amélioration des performances et de l'AUC ROC par rapport à HBOS sur les ensembles de données où les interactions entre les fonctionnalités sont importantes.
Fournit un nouvel outil utile pour détecter les valeurs aberrantes situationnelles ou relationnelles.
Limitations:
Augmentation potentielle de l'évolutivité et du coût de calcul pour les ensembles de données de grande dimension (en raison de l'utilisation d'histogrammes bidimensionnels)
Des recherches supplémentaires sont nécessaires pour déterminer les tailles optimales des compartiments d’histogramme.
Il est nécessaire d'évaluer les performances de généralisation pour différents types de modèles aberrants
👍