プロンプトインジェクション攻撃は、実際のアプリケーションで大規模言語モデル(LLM)の安全な展開に深刻な問題を提起します。この問題を解決するために、著者はAEGISを提案します。 AEGISはプロンプト注入攻撃から守るための自動化された共振化フレームワークです。攻撃と防御のプロンプトは、テキストスロープ最適化(TGO)モジュールを介してLLMベースの評価ループからのフィードバックを利用して繰り返し相互に最適化されます。実際の課題採点データセットでは、AEGISは既存のベースラインを継続的に上回り、攻撃の成功率と検出の両方で優れた堅牢性を達成します。