Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Large Language Models for Cyber Security: A Systematic Literature Review

Created by
  • Haebom

저자

Hanxiang Xu, Shenao Wang, Ningke Li, Kailong Wang, Yanjie Zhao, Kai Chen, Ting Yu, Yang Liu, Haoyu Wang

개요

본 논문은 사이버 보안 분야에서 대규모 언어 모델(LLM)의 활용에 대한 종합적인 검토를 제공합니다. 3만 건 이상의 관련 논문을 수집하고 상위 보안 및 소프트웨어 엔지니어링 학회의 논문 127편을 체계적으로 분석하여 LLM이 사이버 보안 분야의 다양한 문제 해결에 어떻게 사용되고 있는지에 대한 전반적인 관점을 제시합니다. LLM이 취약점 탐지, 악성 코드 분석, 네트워크 침입 탐지, 피싱 탐지 등 광범위한 사이버 보안 작업에 적용되고 있음을 확인하였으며, 훈련 및 평가에 사용되는 데이터셋의 크기와 다양성이 제한적이라는 점과 파인튜닝, 전이 학습, 도메인 특화 사전 훈련 등 LLM을 특정 사이버 보안 도메인에 적용하기 위한 유망한 기술들을 제시합니다. 또한, 더욱 해석 가능하고 설명 가능한 모델의 필요성, 데이터 개인 정보 및 보안 문제 해결의 중요성, 그리고 사전 방어 및 위협 사냥을 위한 LLM 활용 가능성 등 향후 연구의 주요 과제와 기회를 논의합니다.

시사점, 한계점

시사점:
사이버 보안 분야에서 LLM의 광범위한 적용 가능성을 보여줌.
LLM을 사이버 보안에 적용하기 위한 유망한 기술 (파인튜닝, 전이 학습, 도메인 특화 사전 훈련) 제시.
향후 연구 방향 (해석 가능성, 데이터 보안, 사전 방어 및 위협 사냥) 제시.
한계점:
LLM 훈련 및 평가에 사용되는 데이터셋의 크기와 다양성이 제한적임.
더욱 해석 가능하고 설명 가능한 모델 개발의 필요성.
데이터 개인 정보 및 보안 문제 해결의 중요성.
👍