악성 코드 탐지는 고품질 데이터 부족으로 인해 머신러닝 성능에 제약이 있습니다. MalDataGen은 모듈형 딥러닝 모델(예: WGAN-GP, VQ-VAE)을 사용하여 고품질의 합성 표 형식 데이터를 생성하는 오픈 소스 모듈형 프레임워크입니다. 이중 검증(TR-TS/TS-TR), 7개의 분류기 및 유틸리티 메트릭을 사용하여 평가한 결과, MalDataGen은 SDV와 같은 벤치마크보다 뛰어난 성능을 보이며 데이터 유용성을 유지합니다. 유연한 설계로 탐지 파이프라인에 원활하게 통합되어 사이버 보안 응용 분야에 실용적인 솔루션을 제공합니다.