每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

在基于树的遗传编程中实现种群级并行以实现 GPU 加速

Created by
  • Haebom

作者

吴志宏、王立双、孙克斌、李卓兆、程然

大纲

本文提出了 EvoGP,一个用于基于树的遗传编程 (TGP) 的 GPU 加速的高性能框架。EvoGP 解决了诸如程序对象的结构异构性、集成多级并行性的复杂性以及高性能 CUDA 执行与灵活的 Python 环境之间的不兼容性等挑战。EvoGP 通过利用张量化表示、自适应并行策略以及嵌入在 PyTorch 运行时中的自定义 CUDA 内核来实现 GPU 加速。实验结果表明,EvoGP 的吞吐量高达 $10^{11}$ GPops/s,与基于 GPU 的 TGP 实现相比,速度提升高达 $528 倍,与基于 CPU 的库相比,速度提升高达 $18 倍。EvoGP 还支持与各种基于 Python 的环境集成。

Takeaways, Limitations

Takeaways:
提出了一种高效的TGP GPU加速框架。
通过各种并行处理策略和张量化表示来提高性能。
提供与基于 Python 的环境的无缝集成。
表现出高性能和可扩展性。
Limitations:
可能针对特定的 GPU 环境进行优化。
可能缺乏与其他算法的比较分析。
缺乏对提高准确性的具体解释。
👍