Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Enhancing Automated Loop Invariant Generation for Complex Programs with Large Language Models

Created by
  • Haebom

作者

Ruibang Liu, Guoqiang Li, Minyu Chen, Ling-I Wu, Jingyu Ke

概要

本論文は、信頼できるソフトウェアの構築に重要な自動プログラム検証、特に複雑なデータ構造と制御フローが混在する実際のプログラム分析の難しさを解決するためにACInvという新しいツールを提案します。 ACInvは、静的分析と大規模言語モデル(LLM)を組み合わせてループ不変式を生成します。静的分析によってループ情報を抽出してLLMプロンプトに含め、LLMベースの評価器を使用して生成された不変式を検証し、強化、弱め、または拒否して最適な不変式を取得します。実験の結果、ACInvはデータ構造を含むデータセットの既存のツールよりも優れており、データ構造のない数値プログラムでは最先端のツールであるAutoSpecと同様のパフォーマンスを維持しました。データセット全体でAutoSpecよりも21%多くの例を解決し、参照データ構造テンプレートを作成できることがわかりました。

Takeaways、Limitations

Takeaways:
静的解析とLLMを組み合わせて,複雑なプログラムのループ不変式生成問題を効果的に解決する新しい方法を提案した。
データ構造を含むプログラムでは、既存のツールよりも優れたパフォーマンスを示します。
参照データ構造テンプレート生成機能を提供します。
LLMベースの評価器により不変式の精度を検証し改善します。
Limitations:
データ構造のない数値プログラムのパフォーマンスは、最先端のツールと同様のレベルであり、圧倒的なパフォーマンスの向上を示していません。
LLMの性能に依存しているため、LLMの制限はACInvの性能に影響を与える可能性があります。
実験データセットの範囲と多様性によってパフォーマンスが異なる場合があります。より広範な実験が必要な場合があります。
👍