この論文では、複雑な問題解決に困難を伴う大規模言語モデル(LLM)とコード生成LLM(CLLM)の限界を克服するために、プログラミング知識グラフ(PKG)ベースの新しい検索拡張生成(RAG)フレームワークを提示します。 PKGはコードを意味的に表現して検索し、関連するコード部分を正確に検索し、木の剪定を介して無関係なコンテキストを減らします。さらに、再順位付けメカニズムにより、RAG ではなくソリューションを選択的に統合することで幻覚を減らします。ブロック単位と関数単位の2つの検索方法を提案し、HumanEvalとMBPPのベンチマークで最大20%のpass@1精度向上と最先端モデルと比較して最大34%の性能向上を示しました。重要な貢献は、PKGベースの検索、検索精度を向上させるためのツリー剪定、強力なソリューションを選択するための再ランク付け方法、および関連するコメントとdocstringを使用した自動コード拡張のためのFill-in-the-Middle(FIM)強化モジュールです。