Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

AC-DiT: Adaptive Coordination Diffusion Transformer for Mobile Manipulation

Created by
  • Haebom

作者

Sixiang Chen, Jiaming Liu, Siyuan Qian, Han Jiang, Lily Li, Renrui Zhang, Zhuoyang Liu, Chenyang Gu, Chengkai Hou, Pengwei Wang, Zhongyuan Wang, Shanghang Zhang

概要

本論文は、家庭作業で言語条件付きロボット制御を可能にするモバイル操作について説明します。従来の方法は、モバイルベースとマニピュレータの調整に困難があります。これは、モバイルベースの影響を明示的にモデル化できず、さまざまなモダリティの視覚的観察要件を見落とすためです。これを解決するために、本論文では、モバイルベースとマニピュレータの調整を向上させる適応型調整拡散トランス(AC-DiT)を提案する。 AC-DiTは、モビリティツーボディ条件化メカニズムを介してモバイルベースの動きを最初に抽出し、それを全身行動予測のためのコンテキスト情報として使用して、全身制御を可能にします。さらに、知覚認識マルチモーダル条件化戦略により、2D画像と3Dポイントクラウドとの融合重みを動的に調整し、現在の知覚要求に合った視覚的特徴を生成する。シミュレーションと実際のモバイル操作でAC-DiTの性能を検証した。

Takeaways、Limitations

Takeaways:
モバイルベースとマニピュレータ間の調整問題を効果的に解決する新しいアプローチを提示
モビリティツーボディ条件化メカニズムによるモバイルベースの影響を考慮した全身制御可能
知覚認識マルチモーダル条件化戦略による様々な作業段階に適した視覚情報の活用
シミュレーションと実環境での性能検証による実用性の確認
Limitations:
提案された方法の一般化性能に関するさらなる研究の必要性
さまざまな環境や作業のためのロバスト性評価が必要
実際の環境での複雑な状況処理に関するさらなる研究が必要
👍