Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

PRO-V-R1: Reasoning Enhanced Programming Agent for RTL Verification

Created by
  • Haebom
Category
Empty

저자

Yujie Zhao, Zhijing Wu, Zeqing Yuan, Zhongming Yu, Hejia Zhang, Wentao Ni, Chia-Tung Ho, Haoxing Ren, Jishen Zhao

개요

PRO-V-R1은 자율 RTL 검증을 위한 최초의 학습 가능한 오픈 소스 에이전트 프레임워크입니다. 이 논문에서는 (1) LLM 기반 추론과 프로그래밍 도구 사용을 결합한 모듈형 에이전트 시스템인 PRO-V sys를 설계하고, (2) SFT(Supervised Fine-tuning) RTL 검증 에이전트를 위해 시뮬레이션으로 검증된 전문가 수준의 궤적을 구축하는 데이터 구성 파이프라인을 구축하며, (3) 검증 특정 보상을 사용하여 엔드 투 엔드 검증 워크플로우를 최적화하는 효율적인 강화 학습(RL) 알고리즘을 구현했습니다. PRO-V-R1은 기능적 정확도에서 57.7%, 견고한 오류 감지에서 34.0%를 달성하여 기존 자동 검증 시스템보다 성능이 우수하며, 대규모 독점 LLM과 비교해도 유사하거나 더 나은 성능을 보입니다.

시사점, 한계점

PRO-V-R1은 자율 RTL 검증을 위한 최초의 오픈 소스 솔루션을 제공하여, 개발 시간의 주요 병목 현상을 해결하는 데 기여합니다.
오픈 소스 프레임워크를 통해 데이터 개인 정보 보호 위험을 줄이고, 접근성을 높입니다.
PRO-V-R1은 기능적 정확도와 오류 감지 모두에서 기존 SOTA 시스템 및 대규모 독점 LLM을 능가하는 성능을 보입니다.
논문은 PRO-V-R1의 성능을 객관적으로 평가하고 있습니다.
구체적인 한계점은 논문에 명시되지 않았습니다.
👍