每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

多样性促进人工智能生成的文本检测

Created by
  • Haebom

作者

Advik Raj Basani、陈品宇

大纲

人工智能生成的文本检测在防止 LLM 在教育、商业合规、新闻和社交媒体领域的滥用方面正变得越来越重要。以往的检测器通常依赖于标记级似然值或不透明的黑盒分类器,这些分类器容易受到高质量生成和较差的可解释性的影响。在本研究中,我们提出了一个新颖的检测框架 DivEye,它使用基于意外的特征来捕捉文本中不可预测性的变化。受人类创作的文本在词汇和结构不可预测性方面比 LLM 输出表现出更丰富的变化这一观察结果的启发,DivEye 通过一组可解释的统计特征来捕捉这一信号。所提出的方法比现有的零样本检测器性能高出高达 33.2%,并且在多个基准测试中与经过微调的基线相媲美。DivEye 对释义和对抗攻击具有很强的鲁棒性,在各个领域和模型中具有良好的泛化能力,并且在用作辅助信号时可将现有检测器的性能提升高达 18.7%。除了检测之外,DivEye 还提供了对文本被标记原因的可解释见解,指出节奏不可预测性是 LLM 检测的一个强大且研究不足的信号。

Takeaways, Limitations

Takeaways:
DivEye 在 AI 生成的文本检测方面优于现有方法。
使用可解释的统计特征提供对检测结果的洞察。
能够有效抵御释义和对抗性攻击。
它在各种领域和模型中运行良好。
它可以提高现有探测器的性能。
我们表明,节奏不可预测性是 LLM 检测的重要信号。
Limitations:
本文没有提供具体的Limitations。
👍