2024년까지 3500만 개가 넘는 악성 코드 샘플 증가와 Android 기기의 폭발적인 증가로 인해 효과적인 악성 코드 탐지 방법의 중요성이 강조되고 있습니다. 공격자들은 인공 지능을 사용하여 기존 탐지 기술을 쉽게 회피할 수 있는 정교한 악성 코드 변종을 만들고 있습니다. 머신 러닝이 악성 코드 분류에서 가능성을 보여주었지만, 최신 고품질 데이터 세트의 가용성에 크게 의존합니다. 실제 악성 코드 샘플을 얻고 레이블을 지정하는 데 드는 어려움과 높은 비용은 강력한 탐지 모델 개발에 상당한 과제를 제시합니다. 본 논문에서는 조건부 생성적 적대 신경망(cGAN)을 사용하여 합성 표 형식 데이터를 생성하는 MalSynGen이라는 악성 코드 합성 데이터 생성 방법을 제안합니다. 이 데이터는 실제 데이터의 통계적 속성을 유지하고 Android 악성 코드 분류기의 성능을 향상시킵니다. 다양한 데이터 세트와 생성된 데이터의 충실도, 분류 유용성, 프로세스의 계산 효율성을 평가하는 지표를 사용하여 이 접근 방식의 효과를 평가했습니다. 실험 결과 MalSynGen이 다양한 데이터 세트에서 일반화될 수 있으며, 악성 코드 탐지에서 오래된 데이터와 저품질 데이터 문제를 해결하는 실행 가능한 솔루션을 제공한다는 것을 보여줍니다.