每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

代码语义有用吗?基于执行轨迹的代码大型语言模型信息综合研究

Created by
  • Haebom

作者

王健、谢晓飞、胡强、刘尚清、李毅

大纲

本文重点探讨了大规模语言模型(Code LLM)在运行时行为推理能力方面的局限性,以及语义信息表示的不一致性和碎片化。我们提出了一个通用框架来克服这些局限性。该框架将语义信息(例如执行轨迹)集成到与代码任务相关的提示中,并探索了在监督学习微调(SFT)和推理过程中利用语义信息的有效性。实验结果表明,与以往研究相反,语义信息在延长SFT和Code LLM测试时间方面的效用有限。

Takeaways,Limitations

Takeaways:我们提出了一种提升代码法学语言模型(Code LLM)运行时推理能力的新方法,并呼吁重新审视语义信息的实际效用。我们的研究结果与先前的研究结果相悖,为代码法学语言模型(Code LLM)的增强策略提供了新的方向。
Limitations:本研究局限于特定框架和语义信息(执行轨迹),限制了其对其他类型语义信息或方法的推广。此外,本研究缺乏对实验结果与现有研究结果差异原因的深入分析。未来仍需在各种 Code LLM 架构和任务上进行广泛的实验。
👍