본 논문은 급증하는 멀웨어와 광범위한 코드 재사용으로 인해 복잡하게 얽힌 멀웨어 표본 간의 연결 관계를 분석한다. 최신 진화 트렌드를 파악하고, 멀웨어 표본 또는 범주 간의 복잡한 연결을 파악하기 위한 직관적인 도구의 필요성을 제기한다. 이를 위해 6032개의 표본을 포함하는 수동 검토된 멀웨어 소스 코드 데이터 세트를 소개하고, 소프트웨어 공학적 관점에서 규모, 개발 비용, 코드 품질, 보안 및 종속성을 평가한다. 또한, 멀웨어 연결을 명확히 하기 위해 전체적인 관점과 세부적인 관점에서 멀웨어 계보 분석을 제시한다.