Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Context-Augmented Code Generation Using Programming Knowledge Graphs

Created by
  • Haebom

作者

Iman Saberi, Fatemeh Fard

概要

この論文では、複雑な問題解決に困難を伴う大規模言語モデル(LLM)とコード生成LLM(CLLM)の限界を克服するために、プログラミング知識グラフ(PKG)ベースの新しい検索拡張生成(RAG)フレームワークを提示します。 PKGはコードを意味的に表現して検索し、関連するコード部分を正確に検索し、木の剪定を介して無関係なコンテキストを減らします。さらに、再順位付けメカニズムにより、RAG ではなくソリューションを選択的に統合することで幻覚を減らします。ブロック単位と関数単位の2つの検索方法を提案し、HumanEvalとMBPPのベンチマークで最大20%のpass@1精度向上と最先端モデルと比較して最大34%の性能向上を示しました。重要な貢献は、PKGベースの検索、検索精度を向上させるためのツリー剪定、強力なソリューションを選択するための再ランク付け方法、および関連するコメントとdocstringを使用した自動コード拡張のためのFill-in-the-Middle(FIM)強化モジュールです。

Takeaways、Limitations

Takeaways:
PKGを利用した意味ベースのコード検索と正確なコンテキスト管理によりLLMベースのコード生成性能を大幅に向上できることを示した。
木剪定と再順位指定メカニズムによる幻覚問題を効果的に軽減
ブロック単位および関数単位検索方式により、さまざまなコード生成作業に柔軟に対応可能。
FIMモジュールにより、コードの理解度と完成度を高めることができます。
HumanEvalとMBPPのベンチマークでSOTA性能を達成。
Limitations:
PKGの構築と管理のコストと労力はかなりの可能性があります。
PKGの完全性と正確性によっては、パフォーマンスに大きな影響を与える可能性があります。
特定のプログラミング言語またはドメインに偏る可能性があります。
新しいプログラミングパラダイムや言語への適応性に関するさらなる研究が必要です。
👍