本文探讨了代码语言学习模型 (LLM) 在推断运行时行为和理解程序功能方面的局限性。代码语言学习模型 (LLM) 的缺陷在于其缺乏对程序执行行为的推理能力,以及语义信息(例如执行轨迹)的不一致和碎片化表示。为了应对这些挑战,我们提出了一个通用框架,将语义信息(例如执行轨迹)集成到与代码任务相关的提示中,并全面研究了语义信息对提升代码语言学习模型 (LLM) 推理性能的影响。具体而言,我们研究了基于轨迹的语义信息对代码语言学习模型 (LLM) 的监督微调 (SFT) 和推理阶段的影响。实验结果表明,与以往研究不同,语义信息在提升 SFT 和代码语言学习模型 (LLM) 测试时间方面的效用有限。