Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

PRO-V: An Efficient Program Generation Multi-Agent System for Automatic RTL Verification

Created by
  • Haebom

저자

Yujie Zhao, Zhijing Wu, Hejia Zhang, Zhongming Yu, Wentao Ni, Chia-Tung Ho, Haoxing Ren, Jishen Zhao

개요

본 논문은 대규모 언어 모델(LLM)을 활용한 하드웨어 검증 시스템인 PRO-V를 제안합니다. 기존 LLM 기반 하드웨어 검증 시스템이 레지스터 전달 레벨(RTL) 코드 생성에서 기능적 오류를 범하는 문제점을 해결하기 위해, PRO-V는 효율적인 best-of-n 반복 샘플링 전략과 LLM 기반 판정 에이전트를 활용한 검증 프레임워크를 도입했습니다. LLM을 판정 에이전트로 활용하여 컴파일러의 규칙 기반 정적 분석 결과를 자연어로 변환하고, 검증 실패 원인이 RTL 설계 오류인지 테스트벤치 오류인지 판별하는 데 LLM을 활용합니다. 결과적으로 PRO-V는 정상 RTL 구현에 대해 87.17%, RTL 변이체에 대해 76.28%의 검증 정확도를 달성했습니다. 소스 코드는 공개되어 있습니다.

시사점, 한계점

시사점:
LLM을 활용하여 하드웨어 검증의 비용과 노력을 줄일 수 있는 가능성을 제시.
효율적인 best-of-n 반복 샘플링 전략과 LLM 기반 판정 에이전트를 통한 정확도 향상.
LLM을 활용한 자동화된 프롬프트 생성 파이프라인으로 검증 실패 원인 분석 효율 증대.
오픈소스 공개를 통한 연구 확산 및 재현성 확보.
한계점:
87.17% (정상 RTL) 및 76.28% (RTL 변이체)의 정확도는 완벽하지 않으며, 향상의 여지가 존재.
LLM의 성능에 의존적이며, LLM의 한계가 시스템 성능에 영향을 미칠 수 있음.
특정 하드웨어 기술 및 설계 스타일에 대한 의존성이 존재할 가능성.
다양한 종류의 하드웨어 및 복잡도에 대한 일반화 성능에 대한 추가적인 검증 필요.
👍