본 논문은 대규모 언어 모델(LLM)이 다단계 네트워크 공격을 수행할 수 있는지 평가하고, 그 한계를 극복하기 위한 새로운 프레임워크 Incalmo를 제시합니다. 10개의 다단계 네트워크 환경에서 기존 LLM들이 다단계 공격을 성공적으로 수행하지 못함을 보였습니다. Incalmo는 LLM과 환경 사이에 위치하여 LLM이 고수준의 공격 작업(예: 호스트 감염, 네트워크 스캔)을 지정하면, 이를 저수준 명령어로 변환하여 실행하는 추상화 계층입니다. 환경 상태 서비스와 공격 그래프 서비스를 제공하여 LLM이 다단계 공격에 적합한 행동을 선택하도록 돕습니다. Incalmo를 사용한 LLM은 10개의 현실적인 에뮬레이션 네트워크 중 9개에서 자율적으로 다단계 공격을 성공적으로 수행했습니다. 실험 결과, 고수준 추상화의 중요성과 소규모 매개변수 LLM도 Incalmo를 통해 공격을 성공적으로 수행할 수 있음을 보여줍니다.