Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

RoboMemory: Un marco de trabajo multimemoria basado en la agencia para el aprendizaje permanente en sistemas físicos encarnados.

Created by
  • Haebom

Autor

Mingcong Lei, Honghao Cai, Binbin Que, Zezhou Cui, Liangchen Tan, Junkun Hong, Gehan Hu, Shuangyu Zhu, Yimou Wu, Shaohan Jiang, Ge Wang, Zhen Li, Shuguang Cui, Yiming Zhao, Yatong Han

Describir

RoboMemory es un marco de multimemoria inspirado en el cerebro para el aprendizaje continuo en sistemas físicos. Aborda desafíos críticos como el aprendizaje continuo en entornos reales, la latencia de memoria multimódulo, la captura de correlaciones de tareas y la mitigación de bucles infinitos en la planificación de bucle cerrado. Basándose en la neurociencia cognitiva, integra cuatro módulos principales: un preprocesador de información (similar al tálamo), un sistema de memoria corporal permanente (similar al hipocampo), un módulo de planificación de bucle cerrado (similar a la corteza prefrontal) y un ejecutor de bajo nivel (similar al cerebelo), lo que permite la planificación a largo plazo y el aprendizaje acumulativo. El sistema de memoria corporal permanente, en el corazón del marco, mitiga los problemas de velocidad de inferencia de los marcos de memoria complejos al paralelizar actualizaciones y recuperaciones en submódulos espaciales, temporales, episódicos y semánticos. Integra un grafo de conocimiento dinámico (KG) y un diseño arquitectónico consistente para mejorar la consistencia y la escalabilidad de la memoria. Los resultados de la evaluación en EmbodiedBench demuestran que RoboMemory alcanza un nuevo estándar de referencia de vanguardia (SOTA), superando el estándar de referencia de código abierto (Qwen2.5-VL-72B-Ins) en un 25 % de promedio y el estándar de referencia de código cerrado (Claude3.5-Sonnet) en un 5 %. Estudios de eliminación validan los componentes principales (crítica, memoria espacial y memoria a largo plazo), y las implementaciones reales demuestran mejoras significativas en las tasas de éxito en tareas repetidas, lo que confirma su capacidad de aprendizaje continuo. RoboMemory mitiga los problemas de alta latencia mediante la escalabilidad y sirve como base para la integración de sistemas de memoria multimodo en robots físicos.

Takeaways, Limitations

Takeaways:
Resolver problemas de aprendizaje permanente en entornos del mundo real con un marco de memoria múltiple inspirado en el cerebro.
Alivio de problemas de velocidad de inferencia en marcos de memoria complejos a través de búsquedas/actualizaciones de memoria paralelizadas.
Mejora de la consistencia y escalabilidad de la memoria mediante gráficos de conocimiento dinámicos (KG).
Se logró una mejora notable en el rendimiento en comparación con los puntos de referencia de rendimiento de primera clase existentes en las evaluaciones de EmbodiedBench (25 % en comparación con código abierto, 5 % en comparación con SOTA de código cerrado).
Validar las capacidades de aprendizaje permanente y mejorar las tasas de éxito a través de implementaciones en el mundo real.
Proporciona una referencia básica para la integración de sistemas de memoria multimodal en robots físicos.
Limitations:
El artículo no menciona explícitamente el Limitations específico. Se requiere más investigación para analizar los posibles problemas que puedan surgir en aplicaciones reales (p. ej., manejo de situaciones inesperadas, limitaciones físicas del robot, etc.).
Dado que solo se presentan los resultados de la evaluación del desempeño en un entorno específico (EmbodiedBench), se requiere una verificación adicional de la generalización a otros entornos o tareas.
Falta de información detallada sobre el modelo de código cerrado utilizado en la comparación con SOTA.
👍