Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

RoboMemory : un cadre agentique multi-mémoire inspiré du cerveau pour l'apprentissage tout au long de la vie dans les systèmes physiques incorporés

Created by
  • Haebom

Auteur

Mingcong Lei, Honghao Cai, Binbin Que, Zezhou Cui, Liangchen Tan, Junkun Hong, Gehan Hu, Shuangyu Zhu, Yimou Wu, Shaohan Jiang, Ge Wang, Zhen Li, Shuguang Cui, Yiming Zhao, Yatong Han

Contour

RoboMemory est un framework multi-mémoire inspiré du cerveau pour l'apprentissage continu dans les systèmes physiques. Il répond à des défis critiques tels que l'apprentissage continu en environnement réel, la latence mnésique multi-modules, la capture des corrélations entre tâches et la limitation des boucles infinies dans la planification en boucle fermée. S'appuyant sur les neurosciences cognitives, il intègre quatre modules principaux : un préprocesseur d'information (de type thalamus), un système de mémoire incarnée permanente (de type hippocampe), un module de planification en boucle fermée (de type cortex préfrontal) et un exécuteur de bas niveau (de type cervelet), permettant la planification à long terme et l'apprentissage cumulatif. Le système de mémoire incarnée permanente, au cœur du framework, atténue les problèmes de vitesse d'inférence des frameworks de mémoire complexes en parallélisant les mises à jour et les récupérations entre les sous-modules spatiaux, temporels, épisodiques et sémantiques. Il intègre un graphe de connaissances dynamique (KG) et une architecture cohérente pour améliorer la cohérence et l'évolutivité de la mémoire. Les résultats d'évaluation sur EmbodiedBench démontrent que RoboMemory atteint un nouveau benchmark de pointe (SOTA), surpassant le benchmark open source (Qwen2.5-VL-72B-Ins) de 25 % en moyenne et le benchmark SOTA (Claude3.5-Sonnet) de 5 %. Des études d'élimination valident les composants clés (critique, mémoire spatiale et mémoire à long terme), et les déploiements en situation réelle démontrent des améliorations significatives des taux de réussite pour les tâches répétées, confirmant ses capacités d'apprentissage continu. RoboMemory atténue les problèmes de latence élevée grâce à son évolutivité et sert de référence pour l'intégration de systèmes de mémoire multimodes dans des robots physiques.

Takeaways, Limitations

Takeaways:
Résoudre les problèmes d’apprentissage tout au long de la vie dans des environnements réels avec un cadre multi-mémoire inspiré du cerveau.
Atténuer les problèmes de vitesse d'inférence dans les cadres de mémoire complexes grâce à des mises à jour/recherches de mémoire parallélisées.
Amélioration de la cohérence et de l'évolutivité de la mémoire à l'aide de graphiques de connaissances dynamiques (KG).
Amélioration remarquable des performances obtenue par rapport aux meilleurs benchmarks de performances existants dans les évaluations EmbodiedBench (25 % par rapport à l'open source, 5 % par rapport au SOTA à source fermée).
Valider les capacités d’apprentissage tout au long de la vie et améliorer les taux de réussite grâce à des déploiements réels.
Fournit une référence de base pour l'intégration de systèmes de mémoire multimodaux dans des robots physiques.
Limitations:
L'article ne mentionne pas explicitement le Limitations spécifique. Des recherches supplémentaires sont nécessaires pour analyser les problèmes potentiels susceptibles de survenir dans des applications concrètes (par exemple, la gestion de situations inattendues, les limitations physiques du robot, etc.).
ÉTant donné que seuls les résultats de l’évaluation des performances dans un environnement spécifique (EmbodiedBench) sont présentés, une vérification supplémentaire de la généralisabilité à d’autres environnements ou tâches est nécessaire.
Manque d'informations détaillées sur le modèle à source fermée utilisé dans la comparaison avec SOTA.
👍