Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Amélioration de la génération automatique d'invariants de boucle pour les programmes complexes avec de grands modèles de langage

Created by
  • Haebom

Auteur

Ruibang Liu, Guoqiang Li, Minyu Chen, Ling-I Wu, Jingyu Ke

Contour

Cet article propose un nouvel outil, ACInv, pour relever les défis de la vérification automatisée de programmes, essentielle à la création de logiciels fiables, notamment lors de l'analyse de programmes réels avec des structures de données et un flux de contrôle complexes. ACInv génère des invariants de boucle en combinant l'analyse statique avec un modèle de langage à grande échelle (LLM). Il extrait les informations de boucle par analyse statique et les intègre dans l'invite LLM. Il utilise ensuite un évaluateur basé sur LLM pour vérifier les invariants générés et les renforcer, les affaiblir ou les rejeter afin d'obtenir des invariants optimaux. Les résultats expérimentaux montrent qu'ACInv surpasse les outils existants sur les ensembles de données contenant des structures de données, tout en conservant des performances comparables à celles de l'outil de pointe, AutoSpec, sur les programmes numériques sans structures de données. ACInv résout 21 % d'exemples de plus qu'AutoSpec sur l'ensemble des données et génère des modèles de structures de données de référence.

Takeaways, Limitations_

Takeaways:
Nous présentons une nouvelle méthode qui résout efficacement le problème de la génération d'invariants de boucle pour des programmes complexes en combinant l'analyse statique et le LLM.
Il surpasse les outils existants dans les programmes qui incluent des structures de données.
Offre la possibilité de créer des modèles de structure de données de référence.
Nous vérifions et améliorons la précision des invariants à l’aide d’un évaluateur basé sur LLM.
Limitations:
Les performances des programmes numériques sans structures de données sont comparables à celles des outils de pointe, mais ne montrent pas d’améliorations de performances considérables.
ÉTant donné que cela dépend des performances de LLM, les limitations de LLM peuvent affecter les performances d'ACInv.
Les performances peuvent varier en fonction de la portée et de la diversité des données expérimentales. Des expériences plus approfondies peuvent être nécessaires.
👍