每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

参考基础技能发现

Created by
  • Haebom

作者

罗胜根、郑亚伦、徐丹菲、河世勋

大纲

基于参考的技能发现 (RGSD) 是一种新颖的算法,它使用参考数据在语义上有意义的潜在空间中执行技能发现。它使用对比预训练将动作嵌入到单位超球面中,并将每个参考轨迹聚类到唯一的方向上。这使得模型能够同时模仿参考动作并发现各种语义相关的动作。它从一个模拟的 SMPL 类人机器人(包含 359 维观测值和 69 维动作)中学习了结构化技能,例如行走、跑步、出拳和侧身躲避,并发现了相关的新动作。在下游控制任务中,它的表现优于基于模仿的技能习得基线。

Takeaways, Limitations

Takeaways:
我们提出了一种在高维系统中发现语义丰富且结构化的描述的实用方法。
利用参考数据来改进技术发现。
同时模仿和发现新的动作。
在下游控制操作中表现出色。
Limitations:
需要该算法的通用性及其在其他环境中的性能评估。
需要分析参考数据的质量和多样性对结果的影响。
RGSD 的计算复杂性和可扩展性还需要进一步研究。
👍