Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Verbalización de la memoria episódica mediante representaciones jerárquicas de la experiencia robótica a lo largo de la vida

Created by
  • Haebom

Autor

Leonard Barmann, Chad DeChant, Joana Plewnia, Fabian Peller-Konrad, Daniel Bauer, Tamim Asfour, Alex Waibel

Describir

Este artículo se centra en la capacidad de los robots para resumir experiencias a largo plazo y responder preguntas, es decir, para verbalizar la experiencia robótica. Si bien estudios previos han limitado la generalización y la transferibilidad mediante la aplicación de sistemas basados en reglas o modelos profundos afinados a datos de experiencia a corto plazo, este estudio aprovecha un modelo de lenguaje a gran escala preentrenado para verbalizar la experiencia de vida de un robot mediante aprendizaje de cero o pocos disparos. Genera datos jerárquicos estructurados en árbol a partir de memorias episódicas (ME), que representan datos sensoriales y propioceptivos sin procesar a niveles bajos y eventos abstraídos utilizando conceptos de lenguaje natural a niveles altos. El modelo de lenguaje a gran escala actúa como un agente para explorar interactivamente las ME en función de las consultas del usuario, expandiendo dinámicamente los nodos del árbol para encontrar información relevante. Este enfoque mantiene bajos costos computacionales incluso con meses de datos de experiencia robótica. Evaluamos la flexibilidad y escalabilidad de nuestro método utilizando datos simulados de robots domésticos, videos desde el punto de vista humano y grabaciones de robots del mundo real.

Takeaways, Limitations

Takeaways:
Presentamos un método novedoso para verbalizar de manera eficiente las experiencias a largo plazo de los robots aprovechando modelos de lenguaje a gran escala previamente entrenados.
Procese eficientemente grandes cantidades de datos y reduzca los costos computacionales a través de datos estructurados en árboles jerárquicos.
Validación del rendimiento en diversos conjuntos de datos, incluidos datos de simulación, videos desde el punto de vista humano y datos de robots reales.
Potencial para contribuir a mejorar la interacción humano-robot.
Limitations:
Actualmente, las evaluaciones se limitan a simulaciones y datos reales limitados. Se requiere una validación adicional con datos reales más diversos y complejos.
Dada la naturaleza de los modelos lingüísticos de gran tamaño, se necesita más investigación sobre la explicabilidad y la confiabilidad.
Se necesita más investigación sobre la optimización y generalización del diseño de la estructura de árbol.
👍