본 논문은 파운데이션 모델의 잠재 속성 표현에 대한 개입이 출력에 미치는 영향을 조사하여 파운데이션 모델을 분석하는 인과 추론 방법론을 연구한다. 기존의 인과 추론 방법의 이론적 기반에 대한 의문 제기에 대응하여, 논문은 완전성(대상 속성의 표현이 얼마나 철저하게 변환되었는지)과 선택성(비대상 속성이 얼마나 적게 영향을 받았는지)이라는 두 가지 주요 인과 추론 요건을 정의한다. 두 요건 간의 상호 작용을 신뢰성(조화 평균)으로 정의하고, 이들을 측정하고 평가하는 경험적 분석 프레임워크를 제시한다. 이 프레임워크를 사용하여, 다양한 인과 추론 방법(선형 vs. 비선형, 개념 제거 vs. 반사실적 개입 등)을 비교 분석하고, 완전성과 선택성 간의 트레이드 오프, 보다 완전하고 신뢰할 수 있는 방법이 LLM 동작에 미치는 영향, 그리고 비선형 개입의 우수성을 밝힌다.