Cet article explore le mécanisme par lequel un modèle linguistique autorégressif à grande échelle (MLG) prédit les émotions humaines à partir d'un texte. À l'aide de différentes familles et tailles de modèles, l'étude montre que les expressions émotionnelles sont fonctionnellement confinées à des régions spécifiques du modèle. En nous appuyant sur la théorie de l'évaluation cognitive, considérant que les émotions sont générées par des évaluations (jugements) de stimuli environnementaux, nous intervenons de manière causale dans les concepts d'évaluation construits pour induire la production. Les résultats sont cohérents avec les attentes théoriques et intuitives. Cela suggère une nouvelle façon d'intervenir de manière causale et de façonner avec précision la production de textes émotionnels, et pourrait contribuer à la sécurité et à l'alignement dans les régions émotionnelles sensibles.