Sign In

Adapting Large Language Models to Emerging Cybersecurity using Retrieval Augmented Generation

Created by
  • Haebom
Category
Empty

저자

Arnabh Borah, Md Tanvirul Alam, Nidhi Rastogi

개요

사이버 위협 탐지에 LLM을 활용하는 보안 응용 분야가 증가하고 있지만, LLM의 불투명한 추론으로 인해 신뢰도가 제한적이다. 특히, 도메인별 사이버 보안 지식이 필요한 결정에서 더욱 그렇다. 보안 위협은 빠르게 진화하므로 LLM은 과거 사건을 기억할 뿐만 아니라 새로운 취약점과 공격 패턴에 적응해야 한다. 본 연구에서는 사이버 보안 데이터를 컨텍스트화하고 LLM의 지식 유지 및 시간적 추론 정확도를 향상시키기 위해 설계된 RAG 기반 프레임워크를 소개한다. 외부 데이터 세트와 Llama-3-8B-Instruct 모델을 사용하여 기본 RAG, 최적화된 하이브리드 검색 접근 방식을 평가하고 여러 성능 지표에 걸쳐 비교 분석을 수행했다.

시사점, 한계점

하이브리드 검색 방식이 사이버 보안 작업에서 LLM의 적응성과 신뢰성을 강화하는 데 효과적임을 시사한다.
RAG 기반 프레임워크를 통해 LLM의 지식 유지 및 시간적 추론 능력을 향상시킬 수 있다.
Llama-3-8B-Instruct 모델과 외부 데이터 세트를 활용한 실험을 수행했다.
연구 대상의 LLM 모델 및 데이터 세트의 제한적인 범위가 있을 수 있다.
하이브리드 검색 방식의 구체적인 구현 및 최적화 방법에 대한 추가적인 설명이 필요할 수 있다.
실제 사이버 보안 환경에서의 검증에 대한 추가 연구가 필요하다.
👍