본 논문은 대규모 언어 모델(LLM)을 활용한 침투 테스트 연구의 최신 동향을 검토하고, 자동화된 침투 테스트 애플리케이션인 AutoPentest를 제시합니다. AutoPentest는 OpenAI의 GPT-4o와 LangChain 프레임워크를 기반으로 하며, 외부 도구 및 지식베이스를 활용하여 복잡한 다단계 작업을 수행할 수 있습니다. Hack The Box(HTB) 머신을 대상으로 AutoPentest와 ChatGPT-4o 수동 사용 방식을 비교 분석한 결과, 두 방식 모두 15-25%의 하위 작업을 완료했으며, AutoPentest가 약간 더 나은 성능을 보였습니다. 비용 측면에서 AutoPentest는 전체 실험에 96.20달러가 소요된 반면, ChatGPT Plus는 월 20달러의 구독료가 필요했습니다. 연구 결과는 향후 더욱 강력한 LLM과 추가적인 구현 노력을 통해 LLM 기반 침투 테스트가 취약성 관리의 실용적인 부분이 될 가능성을 시사합니다.