Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Puntuación de valores atípicos basada en histograma extendido (EHBOS)

Created by
  • Haebom

Autor

Islam de Tanvir

Describir

El método de detección de valores atípicos basado en histogramas (HBOS) es ampliamente utilizado gracias a su eficiencia computacional y simplicidad. Sin embargo, dado que asume independencia entre características, su capacidad para detectar valores atípicos en conjuntos de datos donde las interacciones entre características son significativas es limitada. En este artículo, proponemos el método de detección de valores atípicos basado en histogramas extendido (EHBOS), una mejora de HBOS que incorpora histogramas bidimensionales para capturar las dependencias entre pares de características. Esta extensión permite a EHBOS identificar anomalías contextuales y basadas en dependencias que HBOS no detecta. Utilizando 17 conjuntos de datos de referencia, evaluamos la eficacia y robustez de EHBOS en diversos escenarios de detección de anomalías. EHBOS supera a HBOS en varios conjuntos de datos donde las interacciones entre características son cruciales para definir la estructura de la anomalía, logrando mejoras significativas en el AUC de ROC. Estos resultados demuestran que EHBOS puede ser una valiosa extensión de HBOS para modelar dependencias complejas de características. Especialmente en conjuntos de datos donde las anomalías contextuales o relacionales juegan un papel importante, EHBOS proporciona una nueva y poderosa herramienta de detección de anomalías.

Takeaways, Limitations

Takeaways:
Proponemos un algoritmo EHBOS que supera las limitaciones del HBOS existente al considerar la interdependencia entre características.
Verificación experimental de la eficacia y robustez de EHBOS en varios escenarios de detección de anomalías.
Observamos un mejor rendimiento y AUC ROC en comparación con HBOS en conjuntos de datos donde las interacciones de características son importantes.
Proporciona una nueva herramienta útil para detectar valores atípicos situacionales o relacionales.
Limitations:
Aumento potencial de la escalabilidad y el coste computacional para conjuntos de datos de alta dimensión (debido al uso de histogramas bidimensionales)
Se necesitan más investigaciones para determinar los tamaños óptimos de los contenedores del histograma.
Necesidad de evaluar el rendimiento de generalización para varios tipos de patrones de valores atípicos
👍