Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

AC-DiT : Transformateur de diffusion à coordination adaptative pour la manipulation mobile

Created by
  • Haebom

Auteur

Sixiang Chen, Jiaming Liu, Siyuan Qian, Han Jiang, Lily Li, Renrui Zhang, Zhuoyang Liu, Chenyang Gu, Chengkai Hou, Pengwei Wang, Zhongyuan Wang, Shanghang Zhang

Contour

Cet article présente une étude sur la manipulation mobile permettant le contrôle de robots conditionnés par le langage dans les tâches ménagères. Les méthodes existantes peinent à coordonner la base mobile et le manipulateur, car elles ne modélisent pas explicitement l'influence de la base mobile et utilisent indifféremment diverses modalités d'observation (2D ou 3D). Pour résoudre ces problèmes, nous proposons un transformateur de diffusion coordonné adaptatif (AC-DiT) qui améliore la coordination entre la base mobile et le manipulateur. AC-DiT utilise un « mécanisme de conditionnement mobilité-corps » qui utilise le mouvement de la base mobile comme information contextuelle pour prédire les actions du manipulateur, et une « stratégie de conditionnement multimodal basée sur la perception » qui ajuste dynamiquement les pondérations de fusion des images 2D et des nuages ​​de points 3D en fonction de l'étape de la tâche. Les performances d'AC-DiT sont vérifiées par des simulations et des expériences en environnements réels.

Takeaways, Limitations_

Takeaways:
La précision et la stabilité des opérations mobiles ont été améliorées en prenant explicitement en compte le mouvement de la base mobile.
Nous avons amélioré la connaissance de la situation en utilisant efficacement les informations visuelles de diverses modalités en fonction de l’étape de travail.
Une nouvelle architecture pour le fonctionnement mobile de bout en bout est présentée.
Les performances ont été vérifiées par simulation et expériences dans des environnements réels.
Limitations:
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de la méthode proposée.
Il y a un manque d’évaluation de l’applicabilité à divers environnements et tâches.
Des recherches supplémentaires sont nécessaires sur les capacités d’évitement des obstacles et de planification dans des environnements complexes.
Des recherches sont nécessaires sur la manière de gérer les situations inattendues qui peuvent survenir lorsqu’elles sont appliquées dans des environnements réels.
👍