악성코드 분석 분야에서 AI 기반 접근 방식은 대량의 데이터 처리에 효과적이지만, 전문가의 시각을 고려하지 않고 데이터 자체(이미지, 시퀀스)에만 집중하는 한계가 있다. 본 논문에서는 전문가 지식을 활용한 전처리 방법을 제안하여 악성코드 의미 분석과 결과 해석력을 향상시킨다. Portable Executable 파일을 위한 JSON 보고서를 생성하는 새로운 전처리 방법을 제시하는데, 이는 정적 및 동적 분석 기능, 패커 서명 탐지, MITRE ATT&CK 및 Malware Behavior Catalog (MBC) 지식을 통합한다. 이 전처리는 악성코드 분석가가 이해할 수 있는 바이너리 파일의 의미론적 표현을 수집하여 AI 모델의 설명 가능성을 높이는 것을 목표로 한다. 제안된 전처리 방법을 사용하여 대규모 언어 모델을 훈련한 결과, 실제 시장을 반영하는 복잡한 데이터셋에서 0.94의 가중 평균 F1 점수를 달성했다.