본 연구는 자동화된 악성코드 탐지 시스템의 발전에도 불구하고, 위협 탐지에 대한 완전한 자연어 설명을 생성하는 문제를 해결하고자 합니다. AutoMalDesc는 전문가가 큐레이션한 소수의 예시를 기반으로 훈련된 후 독립적으로 작동하는 자동 정적 분석 요약 프레임워크입니다. 이 프레임워크는 반복적인 자체 속도 학습 파이프라인을 활용하여 합성 데이터 생성 및 검증 주기를 통해 출력 품질을 점진적으로 향상시키므로 광범위한 수동 데이터 주석이 필요하지 않습니다. 5개의 스크립팅 언어로 된 3,600개의 다양한 샘플에 대한 평가 결과, 반복 간에 통계적으로 유의미한 개선이 나타났으며 요약 품질과 분류 정확도 모두에서 일관된 향상을 보였습니다. 기술적 정밀도와 언어적 일관성을 모두 확인하기 위해, 기존 악성코드 레이블 기반의 정량적 지표와 인간 전문가 및 LLM 기반 판단자 모두의 질적 평가를 결합한 포괄적인 검증 접근 방식을 사용했습니다. 재현 가능성을 높이고 이 분야의 연구를 발전시키기 위해, 주석이 달린 시드 (0.9K) 및 테스트 (3.6K) 데이터 세트를 포함한 10만 개 이상의 스크립트 샘플, 방법론 및 평가 프레임워크를 공개합니다.