Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Nemori: Agente autoorganizador de la memoria inspirado en la ciencia cognitiva

Created by
  • Haebom

Autor

Jiayan Nan, Wenquan Ma, Wenlong Wu, Yize Chen

Describir

Este artículo presenta Nemori, una novedosa arquitectura de memoria autoorganizada basada en principios cognitivos humanos, para abordar la falta de retención persistente de la memoria a largo plazo, lo cual limita la eficacia de los modelos lingüísticos a gran escala (LLM) como agentes autónomos en interacciones a largo plazo. Nemori aborda el problema de la granularidad de las unidades de memoria organizando de forma autónoma los flujos conversacionales en episodios semánticamente coherentes mediante el Principio de Alineación en Dos Pasos, inspirado en la teoría de la segmentación de eventos. Además, el Principio de Predicción-Calibración, inspirado en los principios de la energía libre, permite la evolución adaptativa del conocimiento más allá de las heurísticas predefinidas basadas en las diferencias de predicción. Amplios experimentos con los benchmarks LoCoMo y LongMemEval demuestran que Nemori supera significativamente a los sistemas de vanguardia existentes, especialmente en contextos a largo plazo.

Takeaways, Limitations

Takeaways:
Nemori presenta un nuevo enfoque para resolver el problema de la memoria a largo plazo (LLM): una nueva estructura de memoria autoorganizada basada en principios cognitivos humanos.
Resuelva eficazmente el problema de la granularidad de las unidades de memoria y el problema del desarrollo del conocimiento adaptativo a través del principio de alineación de dos pasos y el principio de predicción-calibración.
La superioridad de Nemori queda demostrada al superar a los sistemas de última generación existentes en los puntos de referencia LoCoMo y LongMemEval.
Presentamos un camino viable para el procesamiento del flujo de trabajo de agentes autónomos, dinámico y a largo plazo.
Limitations:
Más allá del hecho de que las mejoras en el rendimiento de Nemori son particularmente notables en contextos largos, se necesita más investigación para determinar su generalización a otros tipos de interacciones o tareas.
Se necesita un análisis más profundo de la configuración de parámetros específicos y la optimización del principio de alineación de dos pasos y el principio de predicción-calibración.
Se necesita más investigación para evaluar el rendimiento y la solidez de Nemori en situaciones complejas del mundo real.
👍