Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Time-RA: Hacia el razonamiento de series temporales para anomalías con retroalimentación LLM

Created by
  • Haebom

Autor

Yiyuan Yang, Zichuan Liu, Lei Song, Kai Ying, Zhiguang Wang, Tom Bamford, Svitlana Vyetrenko, Jiang Bian, Qingsong Wen

Describir

Este artículo propone Time-RA (Razonamiento de Series Temporales para Anomalías), una novedosa tarea que aprovecha los modelos de lenguaje a gran escala (LLM) para transformar la detección de anomalías de series temporales en una tarea generativa e inferencial. Para superar las limitaciones de los métodos existentes de detección de anomalías de series temporales basados en la clasificación binaria, presentamos el conjunto de datos de referencia multimodal RATs40K, que contiene aproximadamente 40.000 datos del mundo real. RATs40K consta de datos numéricos de series temporales, texto contextual y representaciones visuales, cada una anotada con tipos de anomalías detallados (14 univariados y 6 multivariados) y razonamiento explicativo estructurado. Desarrollamos un sofisticado marco de anotación que aprovecha las etiquetas generadas por conjuntos, refinadas mediante retroalimentación basada en GPT-4, para garantizar la precisión y la interpretabilidad. Una exhaustiva evaluación comparativa de LLM y LLM multimodales demuestra las capacidades y limitaciones de los modelos actuales y destaca la importancia del ajuste fino supervisado. El código y los conjuntos de datos proporcionados están disponibles para respaldar y acelerar la investigación futura.

Takeaways, Limitations

Takeaways:
Proponemos un enfoque de detección de anomalías de series de tiempo generativo e impulsado por inferencias que supera las limitaciones de la detección de anomalías de clasificación binaria convencional.
Contribuye a la investigación futura al proporcionar un conjunto de datos de referencia multimodal, RATs40K, basado en datos del mundo real.
Obtención de datos de anotación de alta calidad a través de un marco de anotación basado en GPT-4.
A través de la evaluación del desempeño de LLM y LLM multimodal, analizamos las fortalezas y debilidades de los modelos y sugerimos la importancia del aprendizaje supervisado.
Ampliar y acelerar la investigación a través de la publicación de códigos fuente y conjuntos de datos abiertos.
Limitations:
El tamaño del conjunto de datos RATs40K puede requerir conjuntos de datos más grandes y diversos en el futuro.
Se necesitan más investigaciones sobre el rendimiento de generalización del enfoque Time-RA propuesto.
La posibilidad de construir un conjunto de datos sesgado hacia un dominio específico y que dé como resultado un rendimiento de generalización deficiente.
Una alta dependencia de GPT-4 puede limitar la reproducibilidad de la investigación dependiendo de la accesibilidad de GPT-4.
👍