本論文は、Graph-based Retrieval-Augmented Generation (GraphRAG)モデルの脆弱性を攻撃する2つの知識中毒攻撃(Knowledge Poisoning Attacks, KPAs)を提示します。 GraphRAGは、生のテキストを構造化された知識グラフに変換してLLMの精度と説明の可能性を向上させるモデルです。提示された2つの攻撃方法は、Targeted KPA(TKPA)とUniversal KPA(UKPA)です. TKPAは、グラフ理論分析を使用して生成されたグラフの脆弱なノードを見つけ、その記述をLLMに書き換えて、特定の質問 - 応答(QA)結果を正確に制御します。 UKPAは、代名詞や依存関係などの言語的手がかりを使用してグローバルに影響力のある単語を変更して、生成されたグラフの構造的整合性を破壊します。実験の結果、少量のテキスト修正だけでGraphRAGのQA精度を大幅に低下させることができ、従来の防御技術がこれらの攻撃を検出できないことを強調しています。