每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

ClustRecNet:一种用于聚类算法推荐的新型端到端深度学习框架

Created by
  • Haebom

作者

穆罕默德德雷扎·巴赫蒂亚里、博格丹·马祖尔、雷纳托·科代罗·德·阿莫林、纪尧姆·拉布索、弗拉基米尔·马卡连科夫

大纲

ClustRecNet 是一个基于深度学习 (DL) 的新型推荐框架,用于确定给定数据集最合适的聚类算法。我们构建了一个全面的数据存储库,其中包含 34,000 个具有不同结构特征的合成数据集,每个数据集都使用十种流行的聚类算法进行处理。使用调整随机指数 (ARI) 评估聚类结果,并建立真实值标签来训练和评估 DL 模型。所提出的网络架构集成了卷积、残差和注意力机制,以捕捉输入数据中的局部和全局结构模式。这有助于学习数据集的压缩表示,并直接推荐最合适的聚类算法,从而减少对人工构建的元特征和传统聚类有效性指标 (CVI) 的依赖。在合成和真实基准测试中进行的大量实验表明,该 DL 模型的性能始终优于现有的 CVI 和最先进的 AutoML 聚类推荐方法。

Takeaways,Limitations

Takeaways:
ClustRecNet 提出了一种利用深度学习解决聚类算法选择问题的新方法。
它优于现有的基于 CVI 和 AutoML 的方法。
支持自动聚类算法选择,减少对手动元特征提取和 CVI 的依赖。
我们已经证明了它对各种数据集的适用性。
Limitations:
我们需要使用大型合成数据集来训练我们的模型。
性能可能因实际数据的特性而异。
模型的复杂性使得解释变得困难。
👍