Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

ImportSnare: Directed "Code Manual" Hijacking in Retrieval-Augmented Code Generation

Created by
  • Haebom

作者

Kai Ye, Liangcai Su, Chenxiong Qian

概要

本稿では、大規模言語モデル(LLM)ベースのコード生成における検索拡張生成(RAG)の脆弱性、特に悪意のある依存性ハイジャック攻撃に関する研究を紹介します。 RAGを使用したコード生成(RACG)は、悪意のある文書を介してLLMと開発者の信頼を悪用して悪意のある依存関係を挿入する攻撃の可能性を示しています。この目的のために、悪意のある文書のランキングを操作するPosition-aware beam searchとLLMを操縦して悪意のある依存関係を推薦するように誘導するMultilingual inductive suggestionsを含むImportSnareという新しい攻撃フレームワークを提案します。 Python、Rust、JavaScriptなど、さまざまな言語で高い成功率(matplotlib、seabornなどの人気ライブラリ基準50%以上)を達成し、低い毒性率(0.01%)でも効果的であることを実験的に証明します。これは、LLMベースの開発におけるサプライチェーンのリスクを強調し、コード生成作業に対するセキュリティ強化の必要性を示唆しています。多言語ベンチマークとデータセットを公開する予定です。

Takeaways、Limitations

Takeaways:
LLMベースのコード生成のセキュリティ脆弱性、特にRAGを使用する際の悪意のある依存関係のハイジャックのリスクを明確に提示します。
ImportSnareフレームワークを通じて効果的な悪意のある依存関係挿入攻撃の可能性を実験的に証明。
LLMベースの開発環境におけるサプライチェーンのセキュリティ強化の必要性を強調。
多言語サポートと多様なプログラミング言語に対する攻撃成功率の提示
今後の研究のための多言語ベンチマークとデータセットの公開予定。
Limitations:
現在提示されている攻撃は、特定の悪意のあるパッケージへの依存を前提としています。さまざまな種類の悪性行為の一般化された攻撃技術の研究が必要です。
ImportSnareの防御技術の研究が不足しています。攻撃防御と緩和戦略のさらなる研究が必要です。
実際の世界シナリオでの攻撃の成功率と効果の追加検証が必要です。
👍