Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Robust Offline Imitation Learning Through State-level Trajectory Stitching

Created by
  • Haebom

作者

Shuze Wang, Yunpeng Mei, Hongjie Cao, Yetian Yuan, Gang Wang, Jian Sun, Jie Chen

概要

本論文は,模倣学習(IL)における高品質専門家データの不足と共変量移動問題を解決するために,低品質非標識データを活用するオフラインIL法を提示する。具体的には、不完全なパイロットデータからステータス - アクションペアをリンクするステータスベースの検索フレームワークを導入して、さまざまで情報豊富なトレーニングパスを作成します。実験の結果、提案された方法は、標準のILベンチマークと実際のロボット作業における一般化とパフォーマンスの両方を大幅に向上させることを示しています。

Takeaways、Limitations

Takeaways:
低品質のデータを活用して模倣学習のデータ効率を高めるための新しい方法を提示します。
ステータスベースの検索フレームワークにより、より多様で情報豊富なトレーニングデータを生成できます。
実際のロボット作業で性能向上を検証し、実用性を実証。
Limitations:
提案された方法の性能向上が特定のベンチマークおよびロボット作業に限定される可能性。
ステータスベースの検索フレームワークの計算コストが高い可能性があります。
さまざまな種類の低品質データの一般化性能評価が不足する可能性があります。
👍