본 논문은 언어 모델의 행동 제어를 위해 원인 발생 메커니즘에 대한 이해와 조작이 필수적임을 강조한다. 기존 연구는 주로 표상 수술(예: 모델 절제 또는 특정 개념과 관련된 선형 부분 공간 조작)과 같은 기법을 사용하여 모델에 개입해왔다. 개입의 영향을 정확히 이해하기 위해서는 반실증적 추론(예: 특정 개입에 따라 모델이 생성했다면 주어진 문장이 어떻게 나타났을지)이 유용하다. 본 논문은 펄의 인과 계층에서 설명한 대로 반실증적 추론이 개입과 개념적으로 다르다는 점을 강조하며, Gumbel-max 트릭을 사용하여 언어 모델을 구조 방정식 모델로 재구성하는 Gumbel 반실증적 생성이라는 프레임워크를 제안한다. 이 재구성을 통해 원본 문자열과 동일한 표본 잡음 인스턴스의 결과로 생성된 반실증적 문자열의 결합 분포를 모델링할 수 있다. 후견적 Gumbel 샘플링을 기반으로 하는 알고리즘을 개발하여 잠재적 잡음 변수를 추론하고 관찰된 문자열의 반실증적 문자열을 생성한다. 실험을 통해 제안된 접근 방식이 의미 있는 반실증적 문자열을 생성하는 동시에 일반적으로 사용되는 개입 기법이 상당한 원치 않는 부작용을 갖는다는 것을 보여준다.