본 논문은 대규모 언어 모델(LLM) 에이전트의 사이버 보안 작업 자동화 능력을 향상시키는 지식 기반 프레임워크인 CRAKEN을 제시합니다. CRAKEN은 과거 LLM 에이전트의 한계점인 최신 전문 지식 접근 및 새로운 지식의 복잡한 작업 계획 통합 문제를 해결하기 위해 세 가지 핵심 메커니즘(작업 중요 정보의 상황적 분해, 반복적 자기 반영 지식 검색, 지식 힌트 주입)을 활용합니다. CTF 풀이를 지식 데이터베이스로 사용하여 NYU CTF Bench에서 22%의 정확도를 달성, 기존 연구보다 3% 향상된 성능을 보였으며, MITRE ATT&CK 기법 평가에서는 기존 연구보다 25-30% 더 많은 기법을 해결하여 향상된 사이버 보안 기능을 입증했습니다. CRAKEN은 오픈소스로 공개되었습니다 (https://github.com/NYU-LLM-CTF/nyuctf_agents_craken).