Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Memp : exploration de la mémoire procédurale des agents

Created by
  • Haebom

Auteur

Runnan Fang, Yuan Liang, Xiaobin Wang, Jialong Wu, Shuofei Qiao, Pengjun Xie, Fei Huang, Huajun Chen, Ningyu Zhang

Contour

Cet article explore des stratégies permettant d'imprégner une mémoire procédurale apprenable, actualisable et permanente afin de résoudre le problème fragile de la mémoire procédurale des agents basés sur des modèles de langage à grande échelle (LLM). Nous proposons une nouvelle méthode, Memp, qui extrait les trajectoires passées de l'agent en instructions détaillées étape par étape et en abstractions de haut niveau de type script. Nous explorons l'impact de diverses stratégies de construction, de récupération et de mise à jour de la mémoire procédurale, et construisons un référentiel mémoire évolutif au gré des nouvelles expériences grâce à un système dynamique qui met à jour, modifie et supprime son contenu en permanence. Les résultats expérimentaux obtenus sur TravelPlanner et ALFWorld démontrent qu'à mesure que le référentiel mémoire est affiné, le taux de réussite et l'efficacité de l'agent sur des tâches similaires s'améliorent régulièrement. De plus, une mémoire procédurale construite sur un modèle robuste conserve sa valeur, ce qui entraîne des améliorations significatives des performances, même lors de la migration vers un modèle plus faible.

Takeaways, Limitations

Takeaways:
Présentation d'une solution efficace au problème de mémoire procédurale pour les agents basés sur LLM.
Démontrer la faisabilité de la mise en œuvre de mémoires procédurales apprenables, actualisables et permanentes.
Suggérant la possibilité d'améliorer les performances des modèles faibles grâce au transfert de la mémoire procédurale apprise à partir de modèles forts.
Améliorer le taux de réussite et l'efficacité des agents grâce à la méthode Memp.
Limitations:
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de la méthode proposée.
L’applicabilité à diverses tâches et environnements doit être évaluée.
Une analyse de l’efficacité de la taille et de la gestion du stockage mémoire est nécessaire.
Une évaluation des performances et une analyse de la robustesse dans des environnements réels et complexes sont nécessaires.
👍