每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

片段目标流行向量(MolFTP)的快速留一近似:从虚拟掩蔽到 Key-LOO,实现无泄漏特征构建

Created by
  • Haebom

作者

纪尧姆·戈丹

大纲

本文介绍了MolFTP(分子片段-靶点普遍性),这是一种紧凑的表征方法,能够提供稳健的预测性能。为了防止交叉验证折叠之间的特征泄漏,我们实现了一个虚拟掩蔽程序,该程序会移除保留分子中存在的片段信息。我们还证明了key-loo(留一法)近似于真正的分子水平留一法(LOO),并且在整个数据集中的偏差小于8%。这使得几乎可以在整个数据集上进行训练,同时保持模型性能的无偏交叉验证估计。总而言之,molFTP提供了一种快速且防泄漏的片段-靶点普遍性向量化方法,并带有一个实用的保护措施(虚拟掩蔽,或key-LOO),其性能近似于LOO,但成本仅为LOO的一小部分。

Takeaways,Limitations

Takeaways:
我们提出了 MolFTP,一种提供强大预测性能的新型分子表示方法。
提出了一种防止特征泄漏的有效方法(虚拟掩蔽)。
Key-loo 有效地近似了 LOO,从而能够进行准确的性能评估,同时降低计算成本。
提供一种快速且防泄漏的片段目标流行矢量化方法。
Limitations:
论文中没有具体提及 Limitations。
👍