每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

SPiDR:模拟到现实迁移中零样本安全的简单方法

Created by
  • Haebom

作者

Yarden As、曲成瑞、Benjamin Unger、Dongho Kang、Max van der Hart、Laxi Shi、Stelian Coros、Adam Wierman、Andreas Krause

大纲

SPiDR(基于悲观域随机化的模拟到现实迁移)是一种旨在解决在模拟器中训练的真实策略中遇到的模拟到现实差距问题的算法。SPiDR 使用域随机化将模拟到现实差距的不确定性纳入安全约束,从而实现安全的模拟到现实迁移。SPiDR 与现有的训练流程兼容,并通过模拟到现实基准测试和在真实机器人平台上的实验证明了其安全性和性能。

Takeaways,Limitations

Takeaways:
尽管模拟与现实存在差距,但它确保了安全性并保持了强劲的性能。
与现有的训练流程兼容。
为安全的 SIM 到 Real 传输提供可扩展的算法。
Limitations:
论文中没有介绍具体的 Limitations。
👍