본 논문은 디코더 전용 트랜스포머의 마지막 토큰 은닉 상태로의 매핑이 일반적으로 주입적임을 밝힌 최근 연구를 정교화한다. 각 레이어별 충돌 판별자를 정의하고 주입적 스트라텀을 설정하여, 모델이 특정 조건 하에서 주입적이지 않거나 주입적 스트라텀이 열리고 조밀하며 모든 매핑이 주입적인 이분법을 증명한다. 또한, 대칭 그룹을 처리하여 주입성이 함수적 등가 클래스의 속성임을 보인다. 저자들은 LLaMA-3 및 Qwen 모델에 대한 실험 연구를 통해 레이어별 기하학적 진단을 수행하여, 분리 마진과 공동 립시츠 상수를 추정하고, 모델 규모, 시퀀스 길이, 활성화 양자화에 따른 동작을 분석했다. 실험 결과는 풀 정밀도 또는 8비트에서 충돌이 없었으며, 4비트 양자화에서 소수의 충돌이 발생하고 공동 립시츠 추정치가 감소했음을 보여준다.