人工智能生成的文本检测在防止 LLM 在教育、商业合规、新闻和社交媒体领域的滥用方面正变得越来越重要。以往的检测器通常依赖于标记级似然值或不透明的黑盒分类器,这些分类器容易受到高质量生成和较差的可解释性的影响。在本研究中,我们提出了一个新颖的检测框架 DivEye,它使用基于意外的特征来捕捉文本中不可预测性的变化。受人类创作的文本在词汇和结构不可预测性方面比 LLM 输出表现出更丰富的变化这一观察结果的启发,DivEye 通过一组可解释的统计特征来捕捉这一信号。所提出的方法比现有的零样本检测器性能高出高达 33.2%,并且在多个基准测试中与经过微调的基线相媲美。DivEye 对释义和对抗攻击具有很强的鲁棒性,在各个领域和模型中具有良好的泛化能力,并且在用作辅助信号时可将现有检测器的性能提升高达 18.7%。除了检测之外,DivEye 还提供了对文本被标记原因的可解释见解,指出节奏不可预测性是 LLM 检测的一个强大且研究不足的信号。