この論文は、自動化された脆弱性検出および回復システムの重要性を強調し、既存の静的プログラム分析方法の制限を指摘しています。既存の方法の拡張性,適応性問題と高い偽陽性と偽陰性率を克服するために,機械学習とディープラーニングに基づくAIアプローチを提案する。しかし、AIベースのアプローチには、トレーニングデータの質と量に大きく依存する問題があります。したがって、この論文では、安全なC / C ++コードベースに現実的なカテゴリ別の脆弱性を自動的に導入してデータセットを生成する新しいフレームワークを紹介します。エキスパート推論をシミュレートする複数のAIエージェント、関数エージェント、および既存のコード分析ツールを調整し、Retrieval-Augmented Generationを活用してコンテキストベースを構築し、Low-Rank近似による効率的なモデル微調整を実行します. 3つのベンチマークの116コードサンプルの実験的研究は、89%〜95%の関数レベルで成功率で脆弱性を注入し、他の技術よりもデータセット精度の点で優れた性能を示すことを確認しました。