Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Una arquitectura en capas para el análisis de registros en sistemas de TI complejos

Created by
  • Haebom

Autor

Thorsten Wittkopp

Describir

Este documento presenta una metodología de análisis de registros basada en una arquitectura de tres niveles para garantizar la estabilidad y confiabilidad del sistema para los equipos de DevOps. El primer nivel, Investigación de Registros, realiza el etiquetado automático de registros y la clasificación de anomalías. Propone un método para etiquetar datos de registros y un sistema de clasificación que categoriza las anomalías en tres categorías, lo que permite el aprendizaje supervisado sin intervención manual. El segundo nivel, Detección de Anomalías, detecta comportamientos anormales y propone un método flexible de detección de anomalías aplicable al aprendizaje supervisado, semisupervisado y no supervisado. Los resultados de la evaluación en conjuntos de datos públicos e industriales demuestran una alta precisión, con una puntuación F1 de 0,98 a 1,0. El tercer nivel, Análisis de Causa Raíz, identifica el conjunto mínimo de registros que explican las fallas del sistema, la causa de la falla y la secuencia de eventos. Al equilibrar los datos de entrenamiento e identificar los servicios clave, el método detecta consistentemente entre el 90 % y el 98 % de las líneas de registro de causa raíz dentro de los 10 candidatos principales, lo que proporciona información útil para la resolución de problemas. Al integrar estas tres capas, los equipos de DevOps tienen una forma poderosa de mejorar la confiabilidad de sus sistemas de TI.

Takeaways, Limitations

Takeaways:
Presentamos una arquitectura de análisis de registros eficiente que contribuye a mejorar la estabilidad y confiabilidad del sistema en un entorno DevOps.
Proponemos una técnica flexible de detección de anomalías aplicable al etiquetado automático de registros y a varios métodos de aprendizaje.
Apoya la resolución rápida de problemas a través de un análisis preciso de la causa raíz.
Prueba de aplicabilidad a sistemas reales con alta precisión (puntuación F1 de 0,98-1,0 y detección de línea de registro de causa raíz del 90-98%).
Limitations:
Se requiere una mayor verificación de la aplicación de la arquitectura propuesta a entornos industriales reales y a resultados operativos a largo plazo.
Se necesitan más investigaciones para determinar la generalización entre diferentes tipos de datos de registro y entornos de sistemas.
Se necesita investigación para determinar los sesgos potenciales en industrias o sistemas específicos y cómo abordarlos.
Falta de detalles sobre el conjunto de datos utilizado.
Falta de análisis de la complejidad computacional y del consumo de recursos.
👍