本論文では、非接触操作の問題を解決するために、モデルベースのアプローチと学習ベースのアプローチを組み合わせた新しいフレームワークを紹介します。モデルベースのアプローチの効率性と学習ベースのアプローチの堅牢性を組み合わせて、連絡先を明示的に考慮する計算効率的な接触固有の軌道最適化(CITO)に基づいてデモガイド深層強化学習(RL)を設計することで、サンプル効率的な学習を達成します。また、特権情報(オブジェクトの質量、サイズ、姿勢など)なしで、固有の水溶性、視覚、力の検出のみを使用してロボットがピボット操作を実行できるように、特権トレーニング戦略を使用したシミュレーション - 実際の移行アプローチを提供します。複数のピボット操作の評価により、シミュレーション - 実際の遷移が正常に実行されたことを示しています。詳しくは、提供されている YouTube リンクの動画をご覧ください。