每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

联合内存频率和计算频率缩放以实现节能的 DNN 推理

Created by
  • Haebom

作者

韩云初、南兆军、周胜、牛志胜

大纲

深度神经网络(DNN)被广泛应用于各个领域,但在资源受限的设备上存在高延迟和能耗问题。目前,大多数研究集中于动态电压和频率调节(DVFS),该技术通过改变处理器的计算频率来平衡延迟和能耗。然而,内存频率调节往往被忽视或未得到充分利用,而无法提升DNN的推理效率。本文采用模型和数据驱动的方法,研究同时调节内存和计算频率对推理时间和能耗的影响。此外,我们结合各种DNN模型的拟合参数对所提出的模型进行了初步分析,并验证了同时调节内存和计算频率的有效性。最后,我们通过本地和协作推理仿真结果验证了联合调节内存和计算频率在降低设备能耗方面的有效性。

Takeaways,Limitations

事实证明,同时调整内存频率和计算频率可以降低能耗。
使用基于模型和数据驱动的方法进行分析。
通过本地和协作推理模拟进行验证。
结合DNN模型的拟合参数来表明分析的普遍性。
未提供论文Limitations的具体内容。
👍