Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Adaptez votre corps : atténuer les changements de proprioception dans l'apprentissage par imitation

Created by
  • Haebom

Auteur

Fuhang Kuang, Jiacheng You, Yingdong Hu, Tong Zhang, Chuan Wen, Yang Gao

Contour

Dans cet article, nous abordons le problème suivant : la simple intégration de tous les états proprioceptifs d’une entrée multimodale (par exemple, images RVB, langage et états proprioceptifs) dans un modèle d’apprentissage par imitation pour des tâches robotiques entraîne de faibles performances d’apprentissage par imitation. Nous définissons ce phénomène comme le « problème de variation proprioceptive » et montrons que le problème réside dans la différence de distribution des états proprioceptifs entre l’apprentissage et le déploiement. Pour y remédier, nous proposons un cadre d’adaptation de domaine qui réduit l’écart entre l’apprentissage et le déploiement en utilisant les données de déploiement collectées pendant le déploiement. Nous quantifions l’inadéquation entre les états proprioceptifs experts et déployés à l’aide de la distance de Wasserstein, et minimisons cet écart en ajoutant un bruit proportionnel à la distance de Wasserstein aux deux ensembles d’états. Les résultats expérimentaux montrent que la méthode proposée améliore les performances des politiques d’imitation en utilisant les informations proprioceptives tout en atténuant leurs effets négatifs.

Takeaways, Limitations

Takeaways:
Nous montrons qu’une simple intégration d’états proprioceptifs peut conduire à une altération des performances d’apprentissage imitatif.
Présentation d’un cadre d’adaptation de domaine efficace pour résoudre le problème du changement proprioceptif.
Preuve de l'efficacité d'une stratégie d'alignement de la distribution des états proprioceptifs utilisant la distance de Wasserstein.
La supériorité de la méthode proposée est vérifiée expérimentalement dans les tâches de manipulation de robots.
Limitations:
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de la méthode proposée.
Des expériences supplémentaires sont nécessaires pour diverses tâches et environnements robotiques.
Une analyse comparative d’autres méthodes de mesure de distance en plus de la distance de Wasserstein est nécessaire.
👍