본 논문은 대규모 언어 모델(LLM) 기반 자동화된 침투 테스트(AutoPT) 프레임워크의 한계점을 해결하기 위해, 지식 기반 자기 반성적 침투 테스트 프레임워크인 RefPentester를 제안합니다. 기존 LLM 기반 AutoPT 프레임워크는 LLM 훈련의 불균형적인 지식, 단기적인 계획, 환각 현상 등으로 인해 인간 전문가보다 성능이 떨어지는데, RefPentester는 침투 테스트 단계 식별, 적절한 전술 및 기법 선택, 단계별 조작 안내, 이전 실패 경험 학습 등의 기능을 통해 이러한 문제를 해결합니다. 침투 테스트 과정을 7단계 상태 머신으로 모델링하여 프레임워크를 효과적으로 통합하였으며, Hack The Box의 Sau 머신을 대상으로 한 평가 결과, 기존 GPT-4o 모델보다 16.7% 향상된 성능을 보였습니다.