Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Proof2Silicon : réparation rapide du code vérifié et génération de matériel via l'apprentissage par renforcement

Created by
  • Haebom

Auteur

Manvi Jha, Jiaxin Wan, Deming Chen

Contour

Cet article présente Proof2Silicon, un nouveau framework de synthèse de bout en bout permettant de générer du matériel formellement vérifié à partir de spécifications en langage naturel. Proof2Silicon s'appuie sur PREFACE, un framework existant indépendant du modèle, pour améliorer le taux de réussite de la vérification du code Dafny généré par LLM basé sur l'apprentissage par renforcement. Il convertit ensuite le code Dafny vérifié en code C et génère une implémentation RTL à l'aide de Vivado HLS. Des évaluations comparatives sur 100 tâches montrent que PREFACE améliore le taux de réussite de la vérification du code Dafny jusqu'à 21 %, tandis que Proof2Silicon atteint un taux de réussite de la synthèse RTL jusqu'à 72 %. Cela démontre un pipeline automatisé robuste et évolutif, des spécifications en langage naturel à l'implémentation sur silicium.

Takeaways, Limitations_

Takeaways:
Nous présentons un pipeline efficace pour générer automatiquement du matériel formellement vérifié à partir de spécifications en langage naturel.
Amélioration de la capacité de génération de code de LLM grâce à une optimisation des invites basée sur l'apprentissage par renforcement.
Fournit un cadre indépendant du modèle applicable à divers LLM.
Il démontre sa faisabilité pratique en obtenant un taux de réussite de synthèse RTL élevé (jusqu'à 72 %).
Limitations:
Il est actuellement limité au langage Dafny, et des recherches sont nécessaires sur son extensibilité à d'autres langages ou systèmes de vérification.
Les performances peuvent varier en fonction de la portée et de la complexité de la tâche d’évaluation.
Il dépend de Vivado HLS et nécessite une prise en compte de la portabilité vers d'autres outils de synthèse.
Un référentiel de 100 tâches peut être relativement limité, et une évaluation plus approfondie de référentiels plus divers et plus complexes est nécessaire.
👍