Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Nemori : Mémoire d'agent auto-organisée inspirée des sciences cognitives

Created by
  • Haebom

Auteur

Jiayan Nan, Wenquan Ma, Wenlong Wu, Yize Chen

Contour

Cet article présente Nemori, une nouvelle architecture de mémoire auto-organisée basée sur les principes cognitifs humains, visant à remédier au manque de rétention persistante de la mémoire à long terme, qui limite l'efficacité des modèles de langage à grande échelle (LLM) en tant qu'agents autonomes dans les interactions à long terme. Nemori aborde le problème de granularité des unités de mémoire en organisant de manière autonome les flux conversationnels en épisodes sémantiquement cohérents grâce au principe d'alignement en deux étapes, inspiré de la théorie de la segmentation des événements. De plus, le principe de prédiction-calibrage, inspiré des principes de l'énergie libre, permet une évolution adaptative des connaissances au-delà des heuristiques prédéfinies basées sur les différences de prédiction. Des expériences approfondies sur les benchmarks LoCoMo et LongMemEval démontrent que Nemori surpasse significativement les systèmes de pointe existants, en particulier dans les contextes à long terme.

Takeaways, Limitations

Takeaways:
Une nouvelle approche pour résoudre le problème de mémoire à long terme du LLM est présentée par Nemori, une nouvelle structure de mémoire auto-organisée basée sur les principes cognitifs humains.
Résolvez efficacement le problème de la granularité des unités de mémoire et le problème du développement adaptatif des connaissances grâce au principe d'alignement en deux étapes et au principe de prédiction-étalonnage.
La supériorité de Nemori est démontrée par ses performances supérieures à celles des systèmes de pointe existants sur les benchmarks LoCoMo et LongMemEval.
Présentation d'une voie réalisable pour le traitement dynamique et autonome des flux de travail des agents à long terme.
Limitations:
Au-delà du fait que les gains de performance de Nemori sont particulièrement notables dans les contextes longs, des recherches supplémentaires sont nécessaires pour déterminer sa généralisabilité à d'autres types d'interactions ou de tâches.
Une analyse plus approfondie est nécessaire sur les paramètres spécifiques et l'optimisation du principe d'alignement en deux étapes et du principe de prédiction-étalonnage.
Des recherches supplémentaires sont nécessaires pour évaluer les performances et la robustesse de Nemori dans des situations complexes du monde réel.
👍