每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

使用机器学习推断可插入类型

Created by
  • Haebom

作者

卡齐·阿曼努尔·伊斯兰·西迪基、马丁·凯洛格

大纲

本文研究了可插拔类型系统的自动类型限定符推断,该系统扩展了编程语言的类型系统,使其能够包含程序员定义的语义属性。具体而言,我们提出了一种利用机器学习自动推断类型限定符的方法,从而能够轻松地将可插拔类型系统应用于遗留代码库。为此,我们提出了一种新颖的表示形式 NaP-AST,并评估了各种模型架构,包括图变换网络 (GTN)、图卷积网络和大型语言模型。我们将模型应用于之前评估 NullAway 可插拔类型检查器时使用的 12 个开源程序,以验证其性能,其中 GTN 表现出最佳性能。此外,我们还开展了研究,以估算训练好的模型达到良好性能所需的 Java 类数量。

Takeaways,Limitations

Takeaways:
我们提出了通过降低采用机器学习可插拔类型系统的门槛来提高遗留代码库类型安全性的可能性。
通过一种称为 NaP-AST 的新表示形式提高类型限定符推断的效率。
GTN 模型表现出较高的召回率(0.89)和准确率(0.6),证明了其在实际开源项目中的有效性。
通过提供模型训练所需的 Java 类数量指南来提高模型开发的效率。
Limitations:
准确度低可能会导致误报。
由于模型过度拟合,许多 Java 类的性能可能会下降。
需要进一步研究将该模型应用于现实世界环境(例如,调整、泛化)。
👍