每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

基于结构的异常检测的偏好隔离森林

Created by
  • Haebom

作者

菲利波·莱文尼、卢卡·马格里、切萨雷·阿利皮、贾科莫·博拉奇

大纲

本文探讨了当样本不符合低维流形所表示的结构模式时,如何检测异常值的问题。为此,我们提出了偏好隔离森林 (PIF),这是一个通用的异常值检测框架,它通过拟合低维流形将数据嵌入高维偏好空间,并将异常值识别为孤立点。PIF 结合了自适应隔离方法的优势和偏好嵌入的灵活性。我们提出了三种用于异常值识别的隔离方法:Voronoi-iForest(最常见的解决方案)、RuzHash-iForest(通过局部敏感哈希避免距离计算)以及 Sliding-PIF(利用局部先验信息来提高效率和有效性)。

Takeaways, Limitations

Takeaways:
我们提出了一种新颖的异常值检测框架 PIF,它结合了基于自适应隔离的方法和偏好嵌入的优点。
提供三种不同的隔离方法:Voronoi-iForest、RuzHash-iForest 和 Sliding-PIF。
比较和分析不同方法以实现高效且有效的异常值检测。
Limitations:
缺乏比较这三种提出的方​​法的性能的详细实验结果。
缺乏对高维偏好空间嵌入过程的详细描述。
需要进一步验证真实数据集上的适用性和泛化性能。
可能容易受到某些类型的异常值的影响。
👍