Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Hume: Introducción al pensamiento del sistema 2 en el modelo visual-lenguaje-acción

Created by
  • Haebom

Autor

Haoming Song, Delin Qu, Yuanqi Yao, Qizhi Chen, Qi Lv, Yiwen Tang, Modi Shi, Guanghui Ren, Maoqing Yao, Bin Zhao, Dong Wang, Xuelong Li

Describir

Este artículo busca proporcionar capacidades de pensamiento similares a las humanas a modelos robóticos, inspirándose en la forma en que los humanos reflexionan lentamente antes de actuar al realizar tareas complejas en el mundo físico. Para ello, proponemos Hume, un modelo de visión-lenguaje-acción (VLA) de sistema dual con pensamiento basado en valores del Sistema 2 y eliminación de ruido en cascada. El Sistema 2 de Hume utiliza una novedosa cabeza de consulta de valores para estimar el valor de estado-acción de las acciones predichas e implementa pensamiento guiado por valores que muestrea repetidamente múltiples candidatos a acciones y selecciona uno en función de dicho valor. El Sistema 1 es una política visual-motora reactiva y ligera que recibe las acciones seleccionadas por el Sistema 2 y realiza la eliminación de ruido en cascada para un control diestro del robot. Durante la implementación, el Sistema 2 realiza pensamiento guiado por valores a baja frecuencia, y el Sistema 1 recibe asincrónicamente los candidatos a acciones seleccionados por el Sistema 2 y predice acciones fluidas en tiempo real. Los resultados experimentales muestran que Hume supera a los modelos VLA de vanguardia existentes en diversas pruebas de referencia de simulación e implementaciones de robots reales.

Takeaways, Limitations

Takeaways:
Aplicar el lento proceso de pensamiento humano al control de robots para mejorar la capacidad de realizar tareas complejas.
El pensamiento basado en valores permite una selección y planificación de acciones eficientes.
Mantener un equilibrio entre el rendimiento en tiempo real y las capacidades de planificación a través de una arquitectura de sistema dual del Sistema 1 y el Sistema 2.
Excelente verificación del rendimiento en diversos entornos de simulación y robots reales.
Limitations:
Se necesita más investigación sobre la eficacia del aprendizaje de la función de valor del modelo propuesto y su desempeño de generalización.
Se necesitan más evaluaciones del desempeño de generalización para diversos entornos de tareas complejas.
Puede haber límites para manejar perfectamente la complejidad y la incertidumbre del mundo real.
Posibles problemas de retraso debido al funcionamiento de baja frecuencia del Sistema 2.
👍