Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

PATH: Un conjunto de datos de secuencia discreta para evaluar enfoques de detección de anomalías no supervisadas en línea para series de tiempo multivariadas

Created by
  • Haebom

Autor

Lucas Correia, Jan-Christoph Goos, Thomas Back, Anna V. Kononova

Describir

Para abordar los desafíos de la investigación sobre la detección de anomalías en series temporales multivariadas, este artículo propone un nuevo conjunto de datos que contiene anomalías diversas, extensas y significativas que reflejan el comportamiento realista de los sistemas de propulsión de automóviles. Este conjunto de datos, generado mediante herramientas de simulación de vanguardia, aborda los desafíos de los conjuntos de datos públicos existentes, incluyendo su tamaño, diversidad y complejidad. Presenta características multivariadas, dinámicas y de estado variable, y aborda problemas de secuencia discreta no abordados en investigaciones previas. Para respaldar las configuraciones de detección de anomalías supervisadas y semisupervisadas, la generación de series temporales y la predicción, proporcionamos múltiples versiones del conjunto de datos, compuestas por datos contaminados y limpios. También presentamos resultados de rendimiento de referencia basados en autocodificadores deterministas y variacionales, así como en enfoques no paramétricos. Nuestros resultados experimentales de referencia demuestran que los modelos entrenados con el conjunto de datos semisupervisados superan a los modelos supervisados, lo que resalta la necesidad de enfoques más robustos para los datos de entrenamiento contaminados. Además, destacamos el impacto significativo del umbral en el rendimiento de la detección, lo que pone de relieve la necesidad de realizar más investigaciones para encontrar umbrales adecuados para datos no etiquetados.

Takeaways, Limitations

Takeaways:
Proporcionar un conjunto de datos de alta calidad para la investigación de detección de anomalías de series temporales multivariadas en el campo del sistema de propulsión automotriz.
Ampliar el área de investigación proporcionando un nuevo conjunto de datos que incluye problemas de secuencia discreta.
Admite entornos de aprendizaje supervisados y semisupervisados
Destaca la importancia de un enfoque sólido para los datos de entrenamiento contaminados.
Se presenta la importancia del establecimiento de umbrales y la necesidad de investigar métodos automatizados de establecimiento de umbrales.
Limitations:
Es posible que el conjunto de datos propuesto no coincida perfectamente con los datos de campo reales.
Falta de una metodología automatizada para el establecimiento de umbrales.
Alcance limitado de los algoritmos utilizados en los experimentos de referencia
👍