본 논문은 활성화 조작 기법을 사용하여 언어 모델의 마음 이론(Theory of Mind, ToM) 능력을 향상시킨 기존 연구의 후속 연구로서, 활성화 조작이 언어 모델 내부에서 어떤 변화를 일으키는지 분석한다. Gemma-3-4B 모델에 Contrastive Activation Addition (CAA) 기법을 적용하여 BigToM forward belief 시나리오에 대한 성능을 평가한 결과, 믿음 귀속 과제 정확도가 향상되었다. 또한, 감정 관련 활성화는 증가하고 분석적 사고 관련 활성화는 감소하는 것을 확인하여, 언어 모델의 ToM 능력은 분석적 추론보다는 감정적 이해에 의해 매개됨을 밝혀냈다.