每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

突触修剪:深度学习正则化的生物学启示

Created by
  • Haebom

作者

吉迪恩·沃斯、丽莎·范·艾克、佐尔坦·萨尔尼亚伊、穆斯塔法·拉希米·阿兹加迪

大纲

受生物大脑中突触修剪的启发,我们提出了一种基于大小的突触修剪方法,该方法可在训练过程中逐步移除低重要性连接。该方法可应用于各种时间序列预测模型,包括 RNN、LSTM 和 Patch Time Series Transformer,取代 Dropout,并直接集成到训练循环中。权重重要性基于绝对大小计算,并使用立方调度来逐步增加全局稀疏性。通过定期且持续地移除低重要性权重并维持活跃权重的梯度流,我们无需单独的修剪和微调步骤。

Takeaways,Limitations

Takeaways:
提出了一种通过模仿生物突触修剪来提高效率的新型正则化技术。
通过替换 Dropout 来提高各种时间序列预测模型的性能。
财务预测中 MAE 降低高达 20%,某些 Transformer 模型中 MAE 降低高达 52%。
直接集成到您的训练循环中,方便使用
无需单独的修剪和微调步骤
Limitations:
性能可能因具体模型架构或数据集特征而异。
需要对泛化性能进行进一步研究。
不能完美地模仿生物大脑中的修剪(例如,依赖于活动的修剪)
👍