Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

PolySim: Bridging the Sim-to-Real Gap for Humanoid Control via Multi-Simulator Dynamics Randomization

Created by
  • Haebom

作者

Zixing Lei, Zibo Zhou, Sheng Yin, Yueru Chen, Qingyao Xu, Weixin Li, Yunhong Wang, Bowei Tang, Wei Jing, Siheng Chen

概要

PolySimは、シミュレータの誘導的バイアスによるsim-to-realギャップを減らすために、複数の異質なシミュレータを統合してポリシーを共同で訓練する全身制御(WBC)トレーニングプラットフォームです。 PolySimは、複数のシミュレータエンジンで並列環境を同時に実行し、動的レベルのドメインランダム化を実現します。理論的には、PolySimはシングルシミュレータのトレーニングよりもシミュレータの誘導偏向のためのより狭い上限を提供します。実験の結果、PolySimはsim-to-sim評価でモーショントラッキングエラーを大幅に削減し、MuJoCoでIsaacSimベースラインと比較して成功率を52.8%向上させました。さらに、微調整を行うことなく、実際のUnitree G1ロボットにゼロショットを展開することができ、シミュレーションから実際の環境への効果的な転送を示しました。

Takeaways、Limitations

Takeaways:
マルチシミュレータ統合によるSim-to-real gapの低減
MuJoCo環境でのパフォーマンス向上
実際のロボット(Unitree G1)のゼロショット展開に成功
Limitations:
論文発表後、PolySimコード公開予定(現在未公開)
具体的なシミュレータの種類と環境設定に関する情報不足
👍