Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Des LLM aux actions : les codes latents comme passerelles dans le contrôle hiérarchique des robots

Created by
  • Haebom

Auteur

Yide Shentu, Philipp Wu, Aravind Rajeswaran, Pieter Abbeel

Contour

Dans cet article, nous proposons des codes latents apprenables comme passerelles (LCB), une nouvelle approche visant à surmonter les limites de l'utilisation de modèles de langage à grande échelle (LLM) comme couche d'interface. Cette approche répond au besoin d'une couche d'interface bien définie pour la communication entre les planificateurs de tâches de haut niveau et les politiques de bas niveau dans le contrôle des robots. Les approches existantes basées sur les LLM présentent des limites : elles sont difficiles à exprimer en langage naturel (par exemple, les mouvements de danse) ou l'apprentissage par transfert est difficile en raison du changement de domaine et de l'oubli catastrophique. Les LCB utilisent des codes latents apprenables comme passerelle entre les LLM et les politiques de bas niveau, permettant aux LLM de transmettre des objectifs de manière flexible sans contraintes linguistiques et permettant l'apprentissage par transfert sans détruire l'espace d'intégration des jetons de mots pré-appris pendant l'apprentissage par transfert. Grâce aux benchmarks Language Table et Calvin, nous vérifions expérimentalement que les LCB surpassent les approches existantes (dont GPT-4V) qui utilisent des langages purs comme couche d'interface dans les tâches nécessitant des inférences et des actions en plusieurs étapes.

Takeaways, Limitations

Takeaways:
Nous proposons une nouvelle approche pour surmonter les limitations linguistiques et résoudre les difficultés de l'apprentissage par transfert en utilisant LLM comme couche d'interface pour le contrôle des robots.
En exploitant des codes latents apprenables pour permettre une communication efficace entre LLM et les politiques de bas niveau, nous améliorons la capacité à effectuer des tâches complexes en plusieurs étapes.
Il a montré des performances supérieures dans les tâches nécessitant des inférences et des opérations en plusieurs étapes par rapport aux méthodes existantes basées sur LLM.
Limitations:
D’autres études sont nécessaires pour étudier les performances de généralisation de la méthode LCB proposée.
Une vérification supplémentaire de son applicabilité à diverses plates-formes et tâches robotiques est nécessaire.
Des études d’optimisation sur la dimensionnalité et la méthode d’apprentissage des codes latents peuvent être nécessaires.
👍