본 논문은 대규모 데이터 수집을 통해 복잡한 현상에 대한 이해를 높이고, 궁극적으로 더 나은 결정을 내릴 수 있다는 점을 강조한다. 특히, 예측 작업에서 성공적인 표현 학습이 교란/개입의 효과를 예측하는 인과 관계 작업에서는 실패할 수 있음을 지적하며, 표현 학습과 인과 추론의 결합을 제시한다. 이를 위해 관찰 및 교란 데이터, 이미징 및 시퀀싱 기반 데이터, 단일 세포 수준에서 유기체 수준의 멀티모달 데이터를 활용하여 인과 구조와 표현 학습을 위한 통계적, 계산적 프레임워크를 제안한다.