Cet article étudie le problème de l'excès de confiance dans les modèles linguistiques à grande échelle (MLH) dans une perspective d'interprétabilité mécaniste. À l'aide du modèle open source Llama 3.2, affiné sur un jeu de données d'assertivité annoté par des humains, nous extrayons les activations résiduelles sur toutes les couches et localisons les expressions assertives à l'aide d'une mesure de similarité. Notre analyse identifie les couches les plus sensibles aux contrastes d'assertivité et révèle que les expressions à forte assertivité se décomposent en deux sous-composantes orthogonales : les groupes affectif et logique, à l'instar du modèle de vraisemblance d'élaboration à double voie en psychologie. Les vecteurs directeurs dérivés de ces sous-composantes présentent des effets causaux distincts, les vecteurs affectifs exerçant une influence large sur la précision des prédictions, tandis que les vecteurs logiques exercent une influence plus localisée. Ces résultats fournissent des preuves mécanistes de la structure multicomposante de l'assertivité des LMH et suggèrent des stratégies pour atténuer les comportements d'excès de confiance.