Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Learning Pivoting Manipulation with Force and Vision Feedback Using Optimization-based Demonstrations

Created by
  • Haebom

作者

白石ゆき、ケイ・オタ、デベシュ・K・ジャ、ディエゴ・ロメレス

概要

本論文では、非接触操作の問題を解決するために、モデルベースのアプローチと学習ベースのアプローチを組み合わせた新しいフレームワークを紹介します。モデルベースのアプローチの効率性と学習ベースのアプローチの堅牢性を組み合わせて、連絡先を明示的に考慮する計算効率的な接触固有の軌道最適化(CITO)に基づいてデモガイド深層強化学習(RL)を設計することで、サンプル効率的な学習を達成します。また、特権情報(オブジェクトの質量、サイズ、姿勢など)なしで、固有の水溶性、視覚、力の検出のみを使用してロボットがピボット操作を実行できるように、特権トレーニング戦略を使用したシミュレーション - 実際の移行アプローチを提供します。複数のピボット操作の評価により、シミュレーション - 実際の遷移が正常に実行されたことを示しています。詳しくは、提供されている YouTube リンクの動画をご覧ください。

Takeaways、Limitations

Takeaways:
モデルベースと学習ベースのアプローチの利点を組み合わせることで、非接触操作の問題に対する効率的で堅牢な解決策を提供します。
CITOとデモガイドRLを使用してサンプル効率的な学習を達成します。
特権情報なしでシミュレーション - 実際の遷移を正常に実行する方法を示します。
実際のロボットシステムでの実験結果により性能を検証します。
Limitations:
提示された方法の一般化性能に関するさらなる研究が必要である。
さまざまな環境やオブジェクトのロバストネスをさらに向上させる必要があります。
特権訓練戦略の依存性は、システムの拡張性に制約を与える可能性があります。
👍