Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

SPiDR: A Simple Approach for Zero-Shot Safety in Sim-to-Real Transfer

Created by
  • Haebom

作者

Yarden As, Chengrui Qu, Benjamin Unger, Dongho Kang, Max van der Hart, Laixi Shi, Stelian Coros, Adam Wierman, Andreas Krause

概要

シミュレータでトレーニングされたポリシーが実際の環境に移行したときに発生するシミュレーションと実際の環境との間のギャップによる安全上の問題を解決するために、安全でスケーラブルな強化学習アルゴリズムであるSim-to-real via Pessimistic Domain Randomization(提案)を提案します。 SPiDRはドメインランダム化を利用して、シミュレーションと実際の環境間の不確実性を安全制約に統合し、既存のトレーニングパイプラインとの互換性を高めました。シミュレーションと2つの実際のロボットプラットフォーム実験により、SPiDRはシミュレーションと実際の環境のギャップにもかかわらず、安全性を保証し、強力な性能を維持することを実証しました。

Takeaways、Limitations

Takeaways:
シミュレーション - 実際の環境ギャップを安全に解決する拡張可能な強化学習アルゴリズムの提案
ドメインランダム化を活用して既存のトレーニングパイプラインとの互換性を確保します。
シミュレーションと実際のロボットプラットフォーム実験により安全性と性能を検証
Limitations:
論文に具体的なLimitationsは記載されていない。
👍