Este artículo explora el mecanismo mediante el cual un modelo lingüístico autorregresivo a gran escala (LLM) predice las emociones humanas a partir del texto. Utilizando diversas familias y tamaños de modelos, el estudio muestra que las expresiones emocionales se limitan funcionalmente a regiones específicas del modelo. Basándonos en la teoría de la evaluación cognitiva, considerando que las emociones se generan mediante evaluaciones (juicios) de estímulos ambientales, intervenimos causalmente en los conceptos de evaluación construidos para inducir su producción, y los resultados concuerdan con las expectativas teóricas e intuitivas. Esto sugiere una nueva forma de intervenir causalmente y moldear con precisión la producción emocional de textos, lo que podría contribuir a la seguridad y la alineación en regiones emocionales sensibles.