Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

SecInfer: Preventing Prompt Injection via Inference-time Scaling

Created by
  • Haebom

作者

Yupei Liu, Yanting Wang, Yuqi Jia, Jinyuan Jia, Neil Zhenqiang Gong

概要

SecInferは、推論時にコンピューティングリソースをさらに割り当ててLLMのパフォーマンスを向上させる新しいパラダイムである\ emph {推論時間スケーリング}に基づいて構築されたプロンプト注入攻撃防御システムです。 SecInferは、system-prompt-guided samplingを介してさまざまなシステムプロンプトを使用して特定の入力に対する複数の応答を生成し、target-task-guided aggregationを介して意図された操作を最もよく実行する可能性の高い応答を選択する2つの主要なステップで構成されています。広範な実験により、SecInferは推論の際に追加のコンピューティングを活用して、既存および適応型プロンプト注入攻撃を効果的に軽減し、最先端の防御システムと既存の推論時間スケーリングアプローチを上回ることを実証しました。

Takeaways、Limitations

Takeaways:
推論の際にコンピューティング資源を活用する新しい防御方式の提示
既存および適応プロンプト注入攻撃に対する効果的な防御力の証明
最先端の防御システムと従来の推論時間スケーリングアプローチより優れた性能
Limitations:
具体的なLimitationsは論文の要約に記載されていません。 (論文原文を確認する必要)
推論時の追加のコンピューティングリソースのニーズ。 (計算コストの増加の可能性)
👍