PARVAL은 대규모 언어 모델(LLM)을 기반으로 한 다중 에이전트 프레임워크로, 네트워크 프로토콜 파서의 구현과 공식 표준 간의 일관성을 자동으로 검증하기 위해 고안되었습니다. 기존의 모델 검증, 퍼징, 차등 테스트와 달리 자연어로 작성된 프로토콜 표준과 소스 코드로 작성된 구현 모두를 이해하는 LLM의 능력을 활용하여, 두 가지를 통합된 중간 표현(포맷 사양)으로 변환하고 차등 비교를 수행하여 불일치를 찾아냅니다. BFD 프로토콜을 대상으로 한 평가 결과, PARVAL은 5.6%의 낮은 오탐율로 구현과 RFC 표준 간의 불일치를 성공적으로 식별했으며, 그 중 5개는 기존에 알려지지 않은 새로운 버그였습니다.