Sign In

Synthesizing Tabular Data Using Selectivity Enhanced Generative Adversarial Networks

Created by
  • Haebom
Category
Empty

저자

Youran Zhou, Jianzhong Qi

개요

본 논문은 블랙프라이데이와 같은 주요 쇼핑 행사 기간 동안 급증하는 전자상거래 플랫폼 거래량을 위한 자원 계획에 필수적인 합성 데이터를 이용한 스트레스 테스트에 초점을 맞추고 있습니다. 기존 GAN 기반 합성 데이터 생성 방법들의 계산 비용 문제점을 지적하며, 데이터베이스 트랜잭션 처리의 핵심 요소인 쿼리 선택성 제약 조건을 통합한 새로운 GAN 기반 접근 방식을 제시합니다. 사전 훈련된 심층 신경망을 통합하여 실제 데이터와 합성 데이터 간의 선택성 일관성을 유지하며, 다섯 개의 실제 데이터셋을 사용한 실험 결과, 기존 세 가지 최첨단 GAN 및 VAE 모델보다 선택성 추정 정확도를 최대 20%, 머신러닝 유틸리티를 최대 6% 향상시켰음을 보여줍니다.

시사점, 한계점

시사점:
전자상거래 플랫폼의 스트레스 테스트를 위한 효율적이고 정확한 합성 데이터 생성 방법 제시
쿼리 선택성 제약 조건을 고려하여 실제 데이터와 유사한 합성 데이터 생성
기존 GAN 기반 방법 대비 선택성 추정 정확도 및 머신러닝 유틸리티 향상
한계점:
제시된 방법의 성능은 사용된 데이터셋에 의존적일 수 있음
실제 전자상거래 시스템의 복잡성을 완전히 반영하지 못할 가능성 존재
특정 유형의 전자상거래 데이터에만 적용 가능할 수 있음
👍