본 논문은 자기회귀형 대규모 언어 모델(LLM)이 텍스트에서 인간의 감정을 예측하는 메커니즘을 탐구한다. 연구는 다양한 모델 패밀리와 크기를 사용하여 감정 표현이 모델의 특정 영역에 기능적으로 국한되어 있음을 보여준다. 인지적 평가 이론을 바탕으로, 환경 자극에 대한 평가(판단)를 통해 감정이 발생한다는 점을 고려하여, 구성된 평가 개념에 인과적으로 개입하여 생성을 유도하고 이론적 및 직관적 기대와 일치하는 결과를 보여준다. 이는 감정적 텍스트 생성을 인과적으로 개입하고 정확하게 형성하는 새로운 방법을 제시하며, 민감한 감정 영역에서 안전성과 정렬에 도움이 될 수 있다.