Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Time-RA: Hacia el razonamiento de series temporales para anomalías con retroalimentación LLM

Created by
  • Haebom

Autor

Yiyuan Yang, Zichuan Liu, Lei Song, Kai Ying, Zhiguang Wang, Tom Bamford, Svitlana Vyetrenko, Jiang Bian, Qingsong Wen

Describir

Para superar las limitaciones de la detección de anomalías de series temporales basada en la clasificación binaria convencional, este artículo propone Time-RA (Time-series Reasoning for Anomalies), una novedosa tarea generativa e inferencial para anomalías de series temporales, que aprovecha los modelos de lenguaje a gran escala (LLM). Presentamos el conjunto de datos de referencia multimodal RATs40K, que consta de aproximadamente 40.000 muestras de datos del mundo real. Cada muestra incluye datos numéricos de series temporales, texto contextual, representaciones visuales, tipos detallados de anomalías (14 univariadas y 6 multivariadas) y razonamiento explicativo estructurado. La precisión y la interpretabilidad se garantizan mediante un sofisticado marco de anotación basado en GPT-4. Una extensa evaluación comparativa de LLM y LLM multimodales demuestra el rendimiento y las limitaciones de los modelos actuales, enfatizando la importancia del ajuste fino basado en el aprendizaje supervisado. El conjunto de datos y el código se ponen a disposición del público para respaldar futuras investigaciones.

Takeaways, Limitations

Takeaways:
Proponemos una nueva tarea Time-RA que va más allá de la detección de anomalías de clasificación binaria tradicional y permite una clasificación detallada y una inferencia explicativa de las anomalías.
Se lanza RATs40K, un conjunto de datos de referencia de detección de anomalías de series temporales multimodales (numéricos, de texto, visuales) basado en datos del mundo real.
Construcción de conjuntos de datos de alta calidad con un marco de anotación sofisticado basado en GPT-4.
Sugerir futuras direcciones de investigación a través de la evaluación del desempeño de LLM y LLM multimodo.
Permitiendo la investigación a través de código abierto y conjuntos de datos.
Limitations:
Tal vez falte un análisis detallado del rendimiento y las limitaciones del modelo actual.
Se necesita una mayor validación del rendimiento de generalización en el conjunto de datos RATs40K.
Se necesita más investigación sobre su aplicabilidad a varios tipos de datos de series de tiempo.
👍