본 논문은 기계 학습 모델을 이용하여 데이터가 부족한 하위 집단에 대한 인과 확률 예측 문제를 다룹니다. Tian과 Pearl이 정의한 세 가지 기본적인 인과 확률(필요충분 확률, 충분 확률, 필요 확률)을 추정하기 위해서는 각 하위 집단에 대한 실험적 및 관찰적 분포가 필요하지만, 데이터가 부족한 하위 집단에서는 이러한 데이터를 얻기 어렵습니다. 따라서 본 논문에서는 데이터가 충분한 하위 집단으로부터 통찰력을 얻는 기계 학습 모델을 이용하여 데이터가 부족한 하위 집단의 인과 확률을 추정하는 방법을 제안합니다. 다양한 기계 학습 모델을 평가한 결과, 적절한 기계 학습 모델과 활성화 함수를 선택하면 필요충분 확률을 효과적으로 예측할 수 있음을 보였습니다. 다층 퍼셉트론(MLP) 모델과 Mish 활성화 함수를 사용하여 시뮬레이션 연구를 수행한 결과, 2,000개의 하위 집단 데이터만을 사용하여 32,768개 하위 집단의 필요충분 확률을 평균 절대 오차(MAE) 약 0.02로 예측할 수 있음을 확인했습니다.