Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Rational Inverse Reasoning

Created by
  • Haebom

作者

Ben Zandonati, Tom as Lozano-P erez, Leslie Pack Kaelbling

概要

本論文は、人間の単一のパイロット学習能力とは異なり、ロボットは一般化に困難を経験していることを指摘し、その原因を知的行動の根本的な説明(潜在的なプログラム)を回復できないためだと主張する。これを解決するために、行動の階層生成モデルを介して潜在的なプログラムを推論するRational Inverse Reasoning(RIR)フレームワークを提案します。 RIRは、視覚言語モデルが構造化された象徴的な作業仮説を繰り返し提案し、計画者ベースの推論システムが観察されたパイロットの可能性を介して各仮説を評価するベイジアンプログラム誘導方式で少数ショット模倣を扱います。これにより、簡潔で実行可能なプログラムの事後確率が得られます。多様な物体姿勢、個数、幾何学的形態、バッチ変化を通じて一回性および少数ショット一般化を評価する連続操作作業セットでRIRを評価した結果、たった1つのパイロットだけでも意図された作業構造を推論し、新しい設定で一般化して最先端の視覚言語モデルベースラインを凌駕する性能を見せた。

Takeaways、Limitations

Takeaways:
RIRフレームワークを通じて、ロボットの少数ショット学習能力の向上の可能性を示した。
視覚言語モデルと計画者を組み合わせることで、より効率的な模倣学習を可能にしました。
単一の試験だけでも一般化が可能なロボット制御システムの開発に貢献できる。
Limitations:
現在は連続操作作業に限られた評価であり、より多様な作業ドメインでの性能検証が必要である。
計画者の性能にRIRの性能が依存するので、計画アルゴリズムの限界がRIRの性能を制限することができる。
複雑なタスクや複数オブジェクトの相互作用を含むタスクの一般化能力にはさらに研究が必要です。
👍