Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

EnvInjection: Environmental Prompt Injection Attack to Multi-modal Web Agents

Created by
  • Haebom

作者

Xilong Wang, John Bloch, Zedian Shao, Yuepeng Hu, Shuyan Zhou, Neil Zhenqiang Gong

概要

本稿では、Webページ環境と対話するマルチモード大規模言語モデル(MLLM)ベースのWebエージェントに対する環境プロンプトインジェクション攻撃(EnvInjection)を提案します。既存の攻撃の効果と秘密性の限界、実際の環境での非実用性を克服するために、レンダリングされたWebページの生のピクセル値に摂動を追加して、Webエージェントが攻撃者が選択した特定のタスク(ターゲットタスク)を実行するように誘導する新しい攻撃技術を提示します。生のピクセル値とスクリーンショットの間のマッピングが微分不可能であるという問題を克服するために、マッピングを近似するニューラルネットワークを訓練し、投影された傾斜降下法を適用して最適化問題を解決します。さまざまなWebページデータセットの広範な評価は、EnvInjectionが既存の基準モデルよりも効果的であることを示しています。

Takeaways、Limitations

Takeaways:
MLLMベースのWebエージェントの脆弱性を効果的に攻撃する新しい技術を提示します。
既存の攻撃のLimitationsである効果性と秘密性の問題を改善しました。
実際の環境適用可能性の向上。
ニューラルネットワークを用いたマッピング近似と最適化手法の有効性の証明
Limitations:
特定のWebページとWebエージェントに依存する存在の可能性。
ニューラルネットワークの訓練と最適化プロセスの複雑さ
攻撃成功率と効果の一般化の可能性に関するさらなる研究が必要
実際のWeb環境での安定性と堅牢性の追加検証が必要です。
👍