Sign In

LCC-LLM: Leveraging Code-Centric Large Language Models for Malware Attribution

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Christopher G. Pedraza Pohlenz, Hassan Jalil Hadi, Ali Hassan, Ali Shoker

πŸ’‘ κ°œμš”

이 논문은 κΈ°μ‘΄ LLM 기반 μ•…μ„±μ½”λ“œ λΆ„μ„μ˜ μ½”λ“œ μˆ˜μ€€ 이해 λΆ€μ‘± 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ μ½”λ“œ μ€‘μ‹¬μ˜ 벀치마크 데이터셋과 증거 기반 ν”„λ ˆμž„μ›Œν¬μΈ LCC-LLM을 μ œμ•ˆν•©λ‹ˆλ‹€. LCC-LLM은 λŒ€κ·œλͺ¨ 역곡학 νŒŒμ΄ν”„λΌμΈμœΌλ‘œ 처리된 μ•½ 34,000개의 PE μƒ˜ν”Œμ„ C μ½”λ“œ, μ–΄μ…ˆλΈ”λ¦¬ μ½”λ“œ, CFG/FCG λ“± λ‹€μ–‘ν•œ ν˜•μ‹μœΌλ‘œ ν‘œν˜„ν•˜λ©°, LangGraphλ₯Ό ν™œμš©ν•œ 정적 뢄석과 닀쀑 μ†ŒμŠ€ 사이버 λ³΄μ•ˆ 지식을 ν†΅ν•©ν•˜μ—¬ 증거 기반 좔둠을 μ§€μ›ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 μ•…μ„±μ½”λ“œ 속성 규λͺ… 및 닀쀑 μž‘μ—… 정적 μ•…μ„±μ½”λ“œ λΆ„μ„μ˜ μ‹ λ’°μ„±κ³Ό 운영 μœ μš©μ„±μ„ ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μ½”λ“œ μ€‘μ‹¬μ˜ ν‘œν˜„κ³Ό 증거 기반 검색 및 검증이 LLM 기반 μ•…μ„±μ½”λ“œ λΆ„μ„μ˜ μ •ν™•μ„±κ³Ό μ‹€μš©μ„±μ„ 크게 ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ LCC-LLM ν”„λ ˆμž„μ›Œν¬λŠ” μ•…μ„±μ½”λ“œ 속성 규λͺ…, IoC μΆ”μΆœ, 취약점 평가 λ“± λ‹€μ–‘ν•œ μ•…μ„±μ½”λ“œ 뢄석 μž‘μ—…μ—μ„œ μš°μˆ˜ν•œ μ„±λŠ₯을 λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μ‹€μ œ μ•…μ„±μ½”λ“œ 사둀 μ—°κ΅¬μ—μ„œ LCC-LLM은 10/10의 κ΅¬μ‘°ν™”λœ 뢄석 ν†΅κ³Όμœ¨μ„ λ‹¬μ„±ν•˜λ©° 뢄석가 μΉœν™”μ μΈ λ³΄κ³ μ„œλ₯Ό μƒμ„±ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
ν–₯ν›„ μ—°κ΅¬μ—μ„œλŠ” 더 λ‹€μ–‘ν•œ μœ ν˜•μ˜ μ•…μ„±μ½”λ“œ 및 κ³ κΈ‰ 뢄석 기법을 μ§€μ›ν•˜λ„λ‘ ν™•μž₯ν•˜κ±°λ‚˜, μ‹€μ‹œκ°„ μœ„ν˜‘ 탐지 μ‹œμŠ€ν…œκ³Όμ˜ 톡합을 κ³ λ €ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘