Cet article présente une méthodologie d'analyse de logs basée sur une architecture à trois niveaux afin de garantir la stabilité et la fiabilité du système pour les équipes DevOps. Le premier niveau, « Investigation des logs », effectue l'étiquetage automatique des logs et la classification des anomalies. Il propose une méthode d'étiquetage des données de logs et un système de classification qui catégorise les anomalies en trois catégories, permettant un apprentissage supervisé sans intervention manuelle. Le deuxième niveau, « Détection des anomalies », détecte les comportements anormaux et propose une méthode flexible de détection des anomalies applicable à l'apprentissage supervisé, semi-supervisé et non supervisé. Les résultats d'évaluation sur des ensembles de données publics et industriels démontrent une grande précision, avec un score F1 compris entre 0,98 et 1,0. Le troisième niveau, « Analyse des causes profondes », identifie l'ensemble minimal de logs expliquant les défaillances du système, la cause de la défaillance et la séquence des événements. En équilibrant les données d'apprentissage et en identifiant les services clés, la méthode détecte systématiquement 90 à 98 % des lignes de logs de causes profondes parmi les 10 principaux candidats, fournissant ainsi des informations exploitables pour la résolution des problèmes. En intégrant ces trois couches, les équipes DevOps disposent d’un moyen puissant d’améliorer la fiabilité de leurs systèmes informatiques.