본 논문은 원인 표상 학습을 통해 모델의 일반화 및 강건성을 향상시키는 연구에 초점을 맞추고 있습니다. 특히, 개입(intervention)에 의해 영향받는 이미지 쌍의 원인 표상을 연구하며, 개입 자체의 표상에 주목합니다. 기존 연구들이 주로 장면 변수의 원인 모델 식별 및 표상에 집중한 것과 달리, 본 논문은 잠재 공간에서 개입을 표현하는 전략을 제시합니다. 구체적으로, 시각적 장면에 불변하고 영향을 받는 원인 변수 측면에서 sparse한 Causal Delta Embedding을 제안합니다. 이를 통해 추가적인 감독 없이 이미지 쌍으로부터 원인 표상을 학습하는 프레임워크를 제시하며, Causal Triplet challenge 실험을 통해 합성 및 실제 벤치마크에서 OOD(Out-of-Distribution) 설정에서 우수한 성능을 보임을 확인합니다.