본 논문은 언어 모델의 행동 제어를 위해 인과적 생성 메커니즘의 이해와 조작이 필수적임을 강조한다. 기존 연구는 주로 표상 외과 수술(예: 모델 절제 또는 특정 개념과 관련된 선형 부분 공간 조작)과 같은 기법에 의존하여 모델에 개입해왔다. 개입의 영향을 정확하게 이해하기 위해서는 반실증적 추론(예: 특정 개입을 따랐을 경우 모델이 생성했을 문장)을 검토하는 것이 유용하다. 본 논문은 Pearl의 인과적 계층 구조에서 설명한 것처럼 반실증적 추론이 개입과 개념적으로 구별됨을 강조한다. 이러한 관찰을 바탕으로 Gumbel-max 트릭을 사용하여 언어 모델을 구조 방정식 모델로 재구성하는 Gumbel 반실증적 생성이라는 프레임워크를 제안한다. 이 재구성을 통해 원본 문자열과 동일한 샘플링 노이즈 인스턴스의 결과로 생성된 반실증적 문자열에 대한 결합 분포를 모델링할 수 있다. 후견적 Gumbel 샘플링을 기반으로 하는 알고리즘을 개발하여 잠재 노이즈 변수를 추론하고 관찰된 문자열의 반실증적 문자열을 생성한다. 실험 결과, 본 접근 방식이 의미 있는 반실증적 문자열을 생성하는 동시에 일반적으로 사용되는 개입 기법이 상당한 원치 않는 부작용을 가짐을 보여준다.