每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

AD-LLM:用于异常检测的大型语言模型基准测试

Created by
  • Haebom

作者

杨天凯、年一、Shawn Li、徐瑞耀、李元刚、李嘉琪、肖卓、胡希阳、Ryan Rossi、丁凯泽、胡夏、赵越

AD-LLM:用于 NLP 异常检测的 LLM

大纲

本文探讨了大规模语言模型 (LLM) 在自然语言处理 (NLP) 异常检测 (AD) 中的潜力。基于 AD-LLM 基准,我们探讨了 LLM 可能对 NLP 异常检测带来的三个关键挑战:(i) 零样本检测;(ii) 数据增强;以及 (iii) 模型选择。使用各种数据集的实验表明,LLM 在零样本 AD 中表现良好,并且精心设计的数据增强方法也十分有效。然而,解释特定数据集的模型选择仍然是一项艰巨的任务。

Takeaways, Limitations

Takeaways:
LLM 可以有效地用于零样本 AD。
基于 LLM 的数据增强技术可以提高 AD 模型的性能。
Limitations:
LLM 在选择适合特定数据集的无监督 AD 模型方面仍然具有挑战性。
需要改进使用 LLM 的模型选择方法。
另外提出了六个使用 LLM 进行 AD 的研究方向作为未来的研究方向。
👍