Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

SCIZOR: A Self-Supervised Approach to Data Curation for Large-Scale Imitation Learning

Created by
  • Haebom

作者

Yu Zhang, Yuqi Xie, Huihan Liu, Rutav Shah, Michael Wan, Linxi Fan, Yuke Zhu

概要

本稿では、ロボットのさまざまな行動を学習する模倣学習において、大規模なデータセットの品質低下の問題を解決するために、自己指導学習ベースのデータ精製フレームワークであるSCIZORを提案します。 SCIZORは、最適ではないデータ(task progression不足)と冗長データ(redundant patterns)の2つの低品質データの原因を扱います。最適でないデータは、自己マップ学習ベースの作業進行予測子を使用して削除し、重複データはjoint state-action表現の重複排除モジュールを使用して削除します。実験の結果、SCIZORは複数のベンチマークで平均15.4%のパフォーマンス向上を示し、少ないデータでも高いパフォーマンスの模倣学習方針を達成することを示しています。

Takeaways、Limitations

Takeaways:
磁気指導学習を用いた効率的なロボットデータ精製方法の提示
従来のデータセットまたはトレクトリーレベルの粗い精製方式との比較、ステートアクションペアレベルの精密な精製が可能
少ないデータで高性能の模倣学習方針を学習可能
最適ではないデータと冗長データを同時に処理してデータ品質を向上
Limitations:
SCIZORのパフォーマンスは、磁気マップ学習ベースのタスクプログレッシブプレディクタとデデュプリケーションモジュールのパフォーマンスに依存する可能性があります。
提案された方法の一般化性能に関するさらなる研究が必要である。さまざまなロボット作業とデータセットの適用性検証が必要です。
Task progress predictor および deduplication module の設計とパラメータ設定の追加の説明と分析が必要です。
👍