Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

RoboMemory: Un marco de trabajo multimemoria basado en la agencia para el aprendizaje permanente en sistemas físicos encarnados.

Created by
  • Haebom

Autor

Mingcong Lei, Honghao Cai, Binbin Que, Zezhou Cui, Liangchen Tan, Junkun Hong, Gehan Hu, Shuangyu Zhu, Yimou Wu, Shaohan Jiang, Ge Wang, Zhen Li, Shuguang Cui, Yiming Zhao, Yatong Han

Describir

RoboMemory es un marco de memoria múltiple inspirado en el cerebro para el aprendizaje continuo en sistemas de implementación física. Aborda desafíos críticos como el aprendizaje continuo en entornos reales, la latencia de memoria multimódulo, la captura de correlaciones de tareas y la mitigación de bucles infinitos en la planificación de bucle cerrado. Basado en la neurociencia cognitiva, integra cuatro módulos principales: un preprocesador de información (similar al tálamo), un sistema de memoria de implementación permanente (similar al hipocampo), un módulo de planificación de bucle cerrado (similar a la corteza prefrontal) y un ejecutor de bajo nivel (similar al cerebelo), lo que permite la planificación a largo plazo y el aprendizaje acumulativo. El sistema de memoria de implementación permanente, en el corazón del marco, mitiga los problemas de velocidad de inferencia de los marcos de memoria complejos mediante actualizaciones/recuperaciones paralelizadas en submódulos espaciales, temporales, episódicos y semánticos. Integra un grafo de conocimiento dinámico (KG) y un diseño arquitectónico consistente para mejorar la consistencia y la escalabilidad de la memoria. Los resultados de la evaluación en EmbodiedBench muestran que RoboMemory alcanza un rendimiento de vanguardia (SOTA) un 25 % superior, en promedio, al del benchmark de código abierto (Qwen2.5-VL-72B-Ins) y un 5 % superior al del benchmark de código cerrado (Claude3.5-Sonnet). Estudios de eliminación validan componentes clave (crítica, memoria espacial y memoria a largo plazo), y las implementaciones reales demuestran su capacidad de aprendizaje continuo, mejorando significativamente las tasas de éxito en tareas repetitivas. RoboMemory mitiga los desafíos de alta latencia mediante la escalabilidad y sirve como base para la integración de sistemas de memoria multimodal en robots físicos.

Takeaways, Limitations

Takeaways:
Resolver eficazmente problemas de aprendizaje permanente en entornos del mundo real con una arquitectura de memoria múltiple inspirada en el cerebro.
Solución de problemas de velocidad de inferencia en marcos de memoria complejos con acceso a memoria paralelizado.
Rendimiento demostrado que supera los modelos SOTA existentes en EmbodiedBench.
Validación de las capacidades de aprendizaje permanente a través de la implementación real de robots.
Proporciona una referencia básica para la integración de sistemas de memoria multimodo.
Limitations:
Actualmente, las evaluaciones de desempeño se han realizado en plataformas y tareas de robots específicas, por lo que la generalización a otros entornos o tareas requiere más investigación.
Falta de análisis detallado del consumo de recursos para implementar y gestionar sistemas de memoria complejos.
Se necesita un análisis en profundidad para abordar posibles problemas de sobrecarga de memoria o estabilidad del sistema que puedan surgir durante el aprendizaje a largo plazo.
Se necesita más investigación sobre la integración y el procesamiento de diferentes tipos de información sensorial.
👍