本文介绍了MolFTP(分子片段-靶点普遍性),这是一种紧凑的表征方法,能够提供稳健的预测性能。为了防止交叉验证折叠之间的特征泄漏,我们实现了一个虚拟掩蔽程序,该程序会移除保留分子中存在的片段信息。我们还证明了key-loo(留一法)近似于真正的分子水平留一法(LOO),并且在整个数据集中的偏差小于8%。这使得几乎可以在整个数据集上进行训练,同时保持模型性能的无偏交叉验证估计。总而言之,molFTP提供了一种快速且防泄漏的片段-靶点普遍性向量化方法,并带有一个实用的保护措施(虚拟掩蔽,或key-LOO),其性能近似于LOO,但成本仅为LOO的一小部分。