Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Can ChatGPT support software verification?

Created by
  • Haebom

作者

Christian Jan{\ss}en, Cedric Richter, Heike Wehrheim

概要

この論文では、大規模言語モデル(LLM)であるChatGPTがループ不変式を生成して、形式的なソフトウェア検証をサポートできるかどうかを調べます。 106個のCプログラムのループ不変式を生成するためにChatGPTを利用し、生成された不変式の有効性と有用性をFrama-CとCPAcheckerを通して検証します。その結果、ChatGPTは有効で有用な不変式を生成し、Frama-Cが以前に解決しなかった操作を検証できることを示しています。

Takeaways、Limitations

Takeaways:
ChatGPTを含むLLMが正式なソフトウェア検証に貢献する可能性を提示します。
ChatGPTによって生成されたループ不変式は検証ツールのパフォーマンスを向上させる可能性があります。
ChatGPTとソフトウェア検証ツールの統合方法を提案する。
Limitations:
106個のCプログラムについて限られた実験を行った。
CPAcheckerを利用した実験結果は示されなかった。
現在のLimitationsと追加の研究課題について議論する。
👍