每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

SecInfer:通过推理时间缩放防止即时注入

Created by
  • Haebom

作者

刘玉佩、王彦婷、贾玉琪、贾金元、龚振强

大纲

SecInfer 是一个基于 \emph{推理时间缩放} 的即时注入攻击防御系统,这是一种新颖的范式,通过在推理过程中分配额外的计算资源来提升 LLM 的性能。SecInfer 主要包含两个步骤:系统提示引导的采样,使用各种系统提示对给定输入生成多个响应;以及目标任务引导的聚合,选择最有可能执行预期任务的响应。大量实验表明,SecInfer 通过在推理过程中利用额外的计算资源,有效地抵御了传统和自适应即时注入攻击,其性能优于最先进的防御系统和现有的推理时间缩放方法。

Takeaways,Limitations

Takeaways:
提出了一种在推理过程中利用计算资源的新型防御方法。
证明了对常规和自适应快速注入攻击的有效防御。
优于最先进的防御系统和现有的推理时间缩放方法。
Limitations:
摘要中未说明具体的Limitations。(请查看原文。)
推理期间需要额外的计算资源(可能会增加计算成本)。
👍