每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

视觉运动政策中需要本体感受状态吗?

Created by
  • Haebom

作者

赵俊图、卢文波、张迪、刘玉峰、梁雨申、张天珞、曹一峰、谢俊元、胡英东、王胜杰、郭俊良、王德全、高阳

大纲

本文重点探讨了基于模仿学习的视觉运动策略在机器人操作中同时利用视觉和本体感受状态信息的局限性。现有方法经实验证明,它们过度依赖本体感受状态信息,导致训练数据过拟合和空间泛化能力较差。因此,我们提出了一种“无状态策略”,该策略消除了本体感受状态信息,仅基于视觉信息预测动作。该策略建立在相对手部执行器动作空间上,并从双广角腕部摄像头接收与任务相关的完整视觉信息。实验结果表明,与基于状态的策略相比,无状态策略在各种机器人实现和任务(包括拾取放置、衬衫折叠和复杂的全身操作)中显著提高了空间泛化性能(高度泛化率从 0% 提高到 85%,水平泛化率从 6% 提高到 64%)。此外,该策略在数据效率和跨实现适应性方面也表现出优势,增强了其在实际部署中的实用性。

Takeaways, Limitations

Takeaways:
我们发现过度依赖本体感受状态信息会阻碍机器人操作的空间泛化性能。
我们证明,仅使用视觉信息的无状态策略可以显著提高空间泛化、数据效率和跨实现的适应性。
通过实验验证了各种机器人任务(拾取和放置、衬衫折叠、全身操作等)和实现的性能改进。
提出现实世界机器人操作应用的实用策略。
Limitations:
可能依赖于特定的视觉信息获取方法,例如双广角腕式摄像头。
需要进一步研究来确定所提出的策略的泛化性能是否可以平等地应用于所有类型的机器人操作任务。
需要进一步验证对各种环境变化的稳健性。
👍