Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Long-Horizo​​n Visual Imitation Learning via Plan and Code Reflection

Created by
  • Haebom

作者

Quan Chen, Chenrui Shi, Qi Chen, Yuwei Wu, Zhi Gao, Xintong Zhang, Rui Gao, Kun Wu, Yunde Jia

概要

本論文は、複雑なアクションシーケンスを持つ長期的なデモンストレーションから学習する視覚的模倣学習の難しさを解決するために、計画とコード生成能力を向上させる2つの反射モジュールを組み込んだ新しいエージェントフレームワークを提案します。このフレームワークは、計画生成モジュールと計画反射モジュールを介してアクションシーケンスの時間的一貫性と空間的整列を保証し、コード生成モジュールとコード反射モジュールを介して生成されたコードの正確さと計画との一貫性を検証し改善します。さらに、時間的および空間的複雑さを強調する18段階のアクションシーケンスを含む新しいベンチマークLongVILBenchを導入して、体系的な評価を支援します。実験結果は、提案されたフレームワークが従来の方法と比較して優れた性能を示すことを示している。

Takeaways、Limitations

Takeaways:
長期実証ベースの視覚模倣学習における時間的および空間的関係を効果的に学習するための新しいフレームワークの提示
計画とコード生成の過程でエラーを検出し修正する反射モジュールの重要性を強調
長期デモンストレーション学習のための新しいベンチマークLongVILBenchの開発と公開
既存の方法の限界を克服し、新しい基準を提示
Limitations:
論文自体で具体的なLimitationsは言及されていない
より多くの実験とさまざまな環境での検証が必要
反射モジュールの計算コストと効率に関するさらなる研究が必要
👍