본 논문은 사이버 보안 분야에서 대규모 언어 모델(LLM)의 활용을 개선하기 위해 다중 에이전트 프레임워크인 D-CIPHER를 제안합니다. 기존의 단일 에이전트 시스템의 한계를 극복하고자, D-CIPHER는 계획자(Planner) 에이전트와 여러 실행자(Executor) 에이전트, 그리고 자동 프롬프트 생성자(Auto-prompter) 에이전트로 구성된 다중 에이전트 시스템을 도입하여 복잡한 Capture the Flag(CTF) 과제 해결에 효율성을 높였습니다. 각 에이전트는 역할을 분담하고 동적인 피드백 루프를 통해 상호 작용하며 문제 해결 능력을 향상시킵니다. NYU CTF Bench, Cybench, HackTheBox 등 여러 CTF 벤치마크를 통해 D-CIPHER의 성능을 평가했으며, 기존 연구 대비 우수한 성능(NYU CTF Bench 22.0%, Cybench 22.5%, HackTheBox 44.0%)과 MITRE ATT&CK 기법 해결 능력 향상을 보였습니다.
시사점, 한계점
•
시사점:
◦
다중 에이전트 시스템을 활용하여 LLM 기반 CTF 문제 해결 능력 향상
◦
역할 분담과 동적 피드백 루프를 통한 효율적인 문제 해결
◦
자동 프롬프트 생성을 통한 문제 해결 능력 개선
◦
기존 연구 대비 향상된 CTF 문제 해결 성능 및 MITRE ATT&CK 기법 적용 범위 확장