Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Interaction homme-objet à partir d'instructions de niveau humain

Created by
  • Haebom

Auteur

Zhen Wu, Jiaman Li, Pei Xu, C. Karen Liu

Contour

Cet article propose un système permettant aux agents intelligents d'interagir de manière autonome avec leur environnement afin d'effectuer des tâches routinières en suivant des instructions de niveau humain. Ce système requiert une compréhension fondamentale du monde pour interpréter avec précision les instructions de niveau humain, ainsi que des compétences précises en mouvement et en interaction de bas niveau pour exécuter les actions dérivées. Nous présentons le premier système complet synthétisant des interactions homme-objet physiquement plausibles et à long terme pour la manipulation d'objets dans des environnements contextuels. En exploitant un modèle de langage à grande échelle (LLM), nous interprétons les instructions d'entrée en plans d'exécution détaillés. Contrairement aux travaux précédents, nous générons des interactions doigt-objet qui se coordonnent parfaitement avec les mouvements du corps entier. De plus, nous entraînons une politique qui suit les mouvements générés à partir de simulations physiques grâce à l'apprentissage par renforcement (RL) afin de garantir leur plausibilité physique. Les résultats expérimentaux démontrent l'efficacité du système à synthétiser des interactions réalistes avec divers objets dans des environnements complexes, soulignant son potentiel d'applications pratiques.

Takeaways, Limitations

Takeaways:
Nous proposons le premier système complet qui comprend les instructions de niveau humain et synthétise des interactions homme-objet à long terme physiquement plausibles.
Créez des interactions réalistes grâce à une coordination fluide des interactions doigts-objets et des mouvements de tout le corps.
Formation politique qui assure la validité physique grâce à l'apprentissage par renforcement.
Démontrer l’applicabilité pratique à travers des expériences avec divers objets et environnements complexes.
Limitations:
Les limites de l’applicabilité réelle du système actuel ne sont pas explicitement mentionnées.
Des recherches supplémentaires sont nécessaires pour déterminer la polyvalence du système et son applicabilité à diverses tâches.
Il existe une possibilité d’erreurs dues à des erreurs d’interprétation dans le LLM ou à des limitations de la simulation physique.
👍