본 논문은 대부분의 입력에 대해 극단적인 활성화를 보이는 마지막 레이어의 '이상치 차원'에 대해 연구한다. 다양한 최신 언어 모델에서 이러한 이상치 차원이 발생함을 보이며, 그 기능이 빈번한 단어를 지속적으로 예측하는 휴리스틱과 관련 있음을 밝힌다. 또한, 모델이 상황에 맞지 않는 경우 나머지 차원에 균형을 이루는 가중치를 할당하여 이 휴리스틱을 차단할 수 있음을 보여준다. 모델 매개변수가 이상치 차원을 증가시키는 시점과 훈련 중 언제 발생하는지 조사한다. 결론적으로, 이상치 차원은 많은 모델이 유용한 토큰 예측 휴리스틱을 구현하기 위해 발견한 특화된 메커니즘이다.