Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Synthetic Data: AI's New Weapon Against Android Malware

Created by
  • Haebom
Category
Empty

저자

Angelo Gaspar Diniz Nogueira, Kayua Oleques Paim, Hendrio Bragan\c{c}a, Rodrigo Brandao Mansilha, Diego Kreutz

개요

2024년까지 3500만 개가 넘는 악성 코드 샘플 증가와 Android 기기의 폭발적인 증가로 인해 효과적인 악성 코드 탐지 방법의 중요성이 강조되고 있습니다. 공격자들은 인공 지능을 사용하여 기존 탐지 기술을 쉽게 회피할 수 있는 정교한 악성 코드 변종을 만들고 있습니다. 머신 러닝이 악성 코드 분류에서 가능성을 보여주었지만, 최신 고품질 데이터 세트의 가용성에 크게 의존합니다. 실제 악성 코드 샘플을 얻고 레이블을 지정하는 데 드는 어려움과 높은 비용은 강력한 탐지 모델 개발에 상당한 과제를 제시합니다. 본 논문에서는 조건부 생성적 적대 신경망(cGAN)을 사용하여 합성 표 형식 데이터를 생성하는 MalSynGen이라는 악성 코드 합성 데이터 생성 방법을 제안합니다. 이 데이터는 실제 데이터의 통계적 속성을 유지하고 Android 악성 코드 분류기의 성능을 향상시킵니다. 다양한 데이터 세트와 생성된 데이터의 충실도, 분류 유용성, 프로세스의 계산 효율성을 평가하는 지표를 사용하여 이 접근 방식의 효과를 평가했습니다. 실험 결과 MalSynGen이 다양한 데이터 세트에서 일반화될 수 있으며, 악성 코드 탐지에서 오래된 데이터와 저품질 데이터 문제를 해결하는 실행 가능한 솔루션을 제공한다는 것을 보여줍니다.

시사점, 한계점

시사점:
MalSynGen은 실제 데이터의 통계적 속성을 보존하는 합성 데이터를 생성하여 악성 코드 탐지 모델의 성능을 향상시킬 수 있습니다.
제안된 방법론은 다양한 데이터 세트에 대해 일반화될 수 있습니다.
MalSynGen은 악성 코드 탐지에서 데이터의 부족 및 품질 저하 문제를 해결하는 데 도움이 될 수 있습니다.
한계점:
논문에 구체적인 한계점이 명시되어 있지 않음. (논문의 내용 요약에서 추론한 내용임)
👍