본 논문은 생물학적 시스템 변화에 책임이 있는 변수를 식별하여 약물 표적 발견 및 세포 공학에 응용하는 방법을 제시합니다. 관찰 데이터와 개입 데이터 쌍이 주어졌을 때, 개입의 표적이었던 관찰 변수의 하위 집합을 분리하는 것이 목표입니다. 기존의 인과 관계 발견 알고리즘을 직접 적용하는 것은 어려운데, 이는 데이터가 수천 개의 변수를 포함하고 개입당 샘플 수는 수십 개에 불과하며, 생물학적 시스템이 고전적인 인과 관계 가정을 따르지 않기 때문입니다. 본 논문에서는 이러한 실제 설정을 해결하기 위해 인과 관계에서 영감을 받은 접근 방식을 제안합니다. 먼저 관찰 데이터와 개입 데이터에서 잡음이 있는 인과 그래프를 추론합니다. 그런 다음 이러한 그래프 간의 차이점과 추가적인 통계적 특징을 개입된 변수 집합에 매핑하는 방법을 학습합니다. 두 모듈은 시뮬레이션 데이터와 생물학적 개입의 특성을 반영하는 실제 데이터에 대해 감독 학습 프레임워크에서 공동으로 학습됩니다. 이 접근 방식은 7개의 단일 세포 전사체학 데이터 세트에 대한 섭동 모델링에서 기준선보다 일관되게 성능이 우수합니다. 또한 다양한 합성 데이터에서 소프트 및 하드 개입 표적을 예측하는 데 있어 기존의 인과 관계 발견 방법보다 상당한 개선을 보여줍니다.