Sign In

MH-1M: A 1.34 Million-Sample Comprehensive Multi-Feature Android Malware Dataset for Machine Learning, Deep Learning, Large Language Models, and Threat Intelligence Research

Created by
  • Haebom
Category
Empty

저자

Hendrio Braganca, Diego Kreutz, Vanderson Rocha, Joner Assolin, and Eduardo Feitosa

개요

MH-1M은 최신 Android 멀웨어 연구를 위한 포괄적인 데이터세트로, 1,340,515개의 애플리케이션, 다양한 기능 및 광범위한 메타데이터를 포함한다. VirusTotal API를 활용하여 정확한 멀웨어 분류를 위해 여러 탐지 엔진을 통합했다. GitHub, Figshare 및 Harvard Dataverse를 통해 400GB 이상의 처리된 데이터세트, 기능 추출 파이프라인의 출력, 해당 VirusTotal 보고서 등 다양한 보조 메타데이터에 대한 오픈 액세스를 제공한다.

시사점, 한계점

MH-1M은 Android 멀웨어 연구를 위한 방대한 데이터 세트를 제공하여 멀웨어 분석 연구를 촉진한다.
VirusTotal API 통합을 통해 정확하고 신뢰할 수 있는 멀웨어 분류를 가능하게 한다.
다양한 저장소를 통해 데이터 및 부가 메타데이터에 쉽게 접근할 수 있도록 한다.
데이터 세트의 크기가 크고, 지속적인 업데이트가 필요할 수 있다.
VirusTotal API 의존성으로 인해 API 사용 제한에 직면할 수 있다.
👍