CA-GAN은 모델 훈련 및 대규모 데이터 분석 등 다양한 작업에 활용되는 표 형식 데이터의 개인 정보 보호 문제와 규제적 제약을 해결하기 위해 개발된 새로운 생성 프레임워크입니다. 이 프레임워크는 복잡한 인과 관계를 포착하고 데이터 유용성을 유지하며 기업 배포에 적합한 입증 가능한 개인 정보 보호를 제공하는 것을 목표로 합니다. CA-GAN은 인과 그래프 추출을 통해 데이터의 복잡한 인과 관계를 학습하고, 인과 그래프의 구조에 따라 작동하는 맞춤형 Conditional WGAN-GP를 활용하는 2단계 접근 방식을 사용합니다. 특히, 생성기는 실제 데이터와 가짜 데이터에서 구성된 인과 그래프를 정렬하는 새로운 강화 학습 기반 목표 함수로 훈련되어 훈련 및 샘플링 단계 모두에서 인과 인식을 보장합니다. CA-GAN은 14개의 표 형식 데이터셋에서 6가지 SOTA 방법보다 우수한 성능을 보였으며, 인과 보존, 유용성 보존, 개인 정보 보호를 핵심 데이터 엔지니어링 지표로 평가했습니다.