Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Verbalisation de la mémoire épisodique à l'aide de représentations hiérarchiques de l'expérience robotique tout au long de la vie

Created by
  • Haebom

Auteur

Leonard Barmann, Chad DeChant, Joana Plewnia, Fabian Peller-Konrad, Daniel Bauer, Tamim Asfour, Alex Waibel

Contour

Cet article se concentre sur la capacité des robots à synthétiser des expériences à long terme et à répondre à des questions, c'est-à-dire à verbaliser l'expérience robotique. Alors que les études précédentes limitaient la généralisation et la transférabilité en appliquant des systèmes basés sur des règles ou des modèles profonds affinés aux données d'expérience à court terme, cette étude s'appuie sur un modèle de langage à grande échelle pré-entraîné pour verbaliser l'expérience d'un robot au cours de sa vie grâce à un apprentissage à zéro ou à quelques coups. Il génère des données arborescentes hiérarchiques à partir de mémoires épisodiques (ME), représentant des données sensorielles et proprioceptives brutes à bas niveau et des événements abstraits utilisant des concepts de langage naturel à haut niveau. Le modèle de langage à grande échelle agit comme un agent pour explorer interactivement les ME en fonction des requêtes des utilisateurs, en développant dynamiquement les nœuds de l'arbre afin de trouver des informations pertinentes. Cette approche maintient de faibles coûts de calcul, même avec des mois de données d'expérience robotique. Nous évaluons la flexibilité et l'évolutivité de notre méthode à l'aide de données de robots domestiques simulés, de vidéos en perspective humaine et d'enregistrements de robots réels.

Takeaways, Limitations

Takeaways:
Nous présentons une nouvelle méthode permettant de verbaliser efficacement les expériences à long terme des robots en exploitant des modèles linguistiques à grande échelle pré-entraînés.
Traitez efficacement de grandes quantités de données et réduisez les coûts de calcul grâce à des données structurées en arborescence hiérarchique.
Validation des performances sur divers ensembles de données, notamment des données de simulation, des vidéos du point de vue humain et des données de robots réels.
Potentiel de contribution à l’amélioration de l’interaction homme-robot.
Limitations:
Actuellement, les évaluations se limitent à des simulations et à des données réelles limitées. Une validation supplémentaire est nécessaire sur des données réelles plus diverses et plus complexes.
ÉTant donné la nature des grands modèles linguistiques, des recherches supplémentaires sont nécessaires sur l’explicabilité et la fiabilité.
Des recherches supplémentaires sont nécessaires sur l’optimisation et la généralisation de la conception de la structure arborescente.
👍