Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

POEX: Towards Policy Executable Jailbreak Attacks Against the LLM-based Robots

Created by
  • Haebom

作者

Xuancun Lu, Zhengxian Huang, Xinfeng Li, Chi Zhang, Xiaoyu ji, Wenyuan Xu

概要

本稿では、大規模言語モデル(LLM)ベースのロボットシステムのセキュリティ脆弱性を調査します。 LLMがロボット命令を実行可能なポリシーに変換する過程で、LLMの刑務所脱出攻撃に対する脆弱性がデジタル領域から物理領域への深刻なセキュリティリスクをもたらす可能性があることを指摘する。研究は、既存のLLM刑務所脱出攻撃のロボットシステムの適用可能性を調査し、新しい攻撃技術であるPOEX(POlicy EXecutable)を提案する。 POEXは、隠れ層勾配最適化とマルチエージェント評価者を使用して実行可能な有害なポリシーを導き、実際のロボットシステムとシミュレーションを通じて効果を検証します。最後に、刑務所脱出攻撃を軽減するためのプロンプトベースおよびモデルベースの防御技術を提案する。

Takeaways、Limitations

Takeaways:
LLMベースのロボットシステムの刑務所脱出攻撃の可能性を実証的に示す
既存のLLM刑務所脱出攻撃がロボットシステムに直接適用されないこととその理由を明らかにする。
ロボットシステムに特化した新しい刑務所脱出攻撃技術であるPOEXを提案し、その効果を検証。
刑務所脱出攻撃のためのプロンプトベースとモデルベースの防御技術を提示します。
LLMベースのロボットを安全に展開するための緊急セキュリティ対策の必要性を強調します。
Limitations:
POEXの効果は特定のロボットシステムとLLMに対して検証されており、他のシステムやLLMの一般化の可能性にはさらなる研究が必要です。
提案された防衛技術の実際の効果と限界のさらなる分析が必要です。
様々なタイプの刑務所脱出攻撃と防衛技術の包括的な研究が必要です。
👍