每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

时空知识整合:大气时间序列预报的轻量级方法

Created by
  • Haebom

作者

付义松、王飞、邵泽志、刁博宇、吴林、安竹林、于成庆、李玉杰、徐勇军

大纲

本文从大气动力学的理论视角重新审视了大气时间序列预测 (ATSF),以解决 Transformer 结构复杂导致的参数数量过多和训练时间过长的问题。我们提出了一个关键的洞见:时空位置嵌入 (STPE) 无需注意力机制即可对时空相关性进行建模。基于此洞见,我们提出了 STELLA,这是一个仅使用 STPE 和多层线性预测 (MLP) 架构的轻量级模型。STELLA 在五个数据集上、包含 10,000 个参数、训练时间为 1 小时的测试中,其性能优于现有的最佳方法。我们强调了在复杂架构中整合时空知识的有效性,为 ATSF 提供了新的见解。

Takeaways, Limitations

Takeaways:
克服Transformer的复杂性,通过轻量级模型实现ATSF的性能提升。
通过实证证明使用 STPE 进行时空知识整合的有效性。
通过10000个参数和1小时的训练,取得了优异的性能,显著提高了可扩展性和效率。
为ATSF研究提出了新的方向。
Limitations:
需要进一步验证所提出模型的泛化性能。
需要进一步研究来确定对各种气象现象和数据集的适用性。
STPE 的效果可能会偏向某些类型的数据集。
👍