본 논문은 RFC 문서에 명시된 동작과 구현 간의 불일치(기능적 버그)를 감지하기 위해 대규모 언어 모델(LLM)을 활용하는 자율 에이전트인 RFCScan을 제시합니다. RFCScan은 인덱싱 에이전트와 감지 에이전트의 두 가지 주요 구성 요소로 이루어져 있으며, 인덱싱 에이전트는 프로토콜 코드 의미를 계층적으로 요약하여 의미 인덱스를 생성하고, 감지 에이전트는 필요에 따라 추가적인 관련 데이터 구조 및 함수를 반복적으로 수집하여 RFC 명세와의 불일치를 효과적으로 식별합니다. 실제 네트워크 프로토콜 구현 6개를 대상으로 평가한 결과, RFCScan은 81.9%의 정밀도로 47개의 기능적 버그를 식별했으며, 그중 20개는 개발자에 의해 확인 또는 수정되었습니다.