Cet article analyse systématiquement les traits de personnalité dans les modèles linguistiques à grande échelle (MLH), évaluant la dynamique de leur expression à travers les étapes d'apprentissage, la validité prédictive des traits autodéclarés et l'impact d'interventions telles que l'infusion de personnalité. Nos résultats démontrent que l'ajustement pédagogique (par exemple, RLHF) stabilise l'expression des traits et renforce leurs corrélations, comme dans les données humaines. Cependant, les traits autodéclarés ne prédisent pas de manière fiable le comportement, et les corrélations observées ne correspondent souvent pas aux schémas humains. L'infusion de personnalité oriente efficacement les autodéclarations dans la direction souhaitée, mais a des effets limités, voire incohérents, sur le comportement réel. Par conséquent, en distinguant l'expression superficielle des traits de la cohérence comportementale, nous remettons en question les hypothèses sur la personnalité dans les LHH et soulignons la nécessité d'une évaluation plus approfondie de l'alignement et de l'interprétabilité.