PRO-V-R1은 자율 RTL 검증을 위한 최초의 학습 가능한 오픈 소스 에이전트 프레임워크입니다. 이 논문에서는 (1) LLM 기반 추론과 프로그래밍 도구 사용을 결합한 모듈형 에이전트 시스템인 PRO-V sys를 설계하고, (2) SFT(Supervised Fine-tuning) RTL 검증 에이전트를 위해 시뮬레이션으로 검증된 전문가 수준의 궤적을 구축하는 데이터 구성 파이프라인을 구축하며, (3) 검증 특정 보상을 사용하여 엔드 투 엔드 검증 워크플로우를 최적화하는 효율적인 강화 학습(RL) 알고리즘을 구현했습니다. PRO-V-R1은 기능적 정확도에서 57.7%, 견고한 오류 감지에서 34.0%를 달성하여 기존 자동 검증 시스템보다 성능이 우수하며, 대규모 독점 LLM과 비교해도 유사하거나 더 나은 성능을 보입니다.
시사점, 한계점
•
PRO-V-R1은 자율 RTL 검증을 위한 최초의 오픈 소스 솔루션을 제공하여, 개발 시간의 주요 병목 현상을 해결하는 데 기여합니다.
•
오픈 소스 프레임워크를 통해 데이터 개인 정보 보호 위험을 줄이고, 접근성을 높입니다.
•
PRO-V-R1은 기능적 정확도와 오류 감지 모두에서 기존 SOTA 시스템 및 대규모 독점 LLM을 능가하는 성능을 보입니다.