Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

De los LLM a las acciones: códigos latentes como puentes en el control jerárquico de robots

Created by
  • Haebom

Autor

Yide Shentu, Philipp Wu, Aravind Rajeswaran, Pieter Abbeel

Describir

En este artículo, proponemos Códigos Latentes Aprendibles como Puentes (LCB), un enfoque novedoso para superar las limitaciones del uso de modelos de lenguaje a gran escala (LLM) como capa de interfaz y abordar la necesidad de una capa de interfaz bien definida para la comunicación entre los planificadores de tareas de alto nivel y las políticas de bajo nivel en el control de robots. Los enfoques existentes basados ​​en LLM presentan limitaciones, ya que son difíciles de expresar en lenguaje natural (p. ej., pasos de baile) o porque el aprendizaje por transferencia es difícil debido al cambio de dominio y al olvido catastrófico. LCB utiliza códigos latentes aprendibles como puente entre los LLM y las políticas de bajo nivel, lo que permite a los LLM transmitir objetivos de forma flexible sin restricciones lingüísticas y posibilita el aprendizaje por transferencia sin destruir el espacio de incrustación de los tokens de palabras preaprendidas durante el aprendizaje por transferencia. Mediante la Tabla de Lenguaje y los puntos de referencia de Calvin, verificamos experimentalmente que LCB supera a los enfoques existentes (incluido GPT-4V) que utilizan lenguajes puros como capa de interfaz en tareas que requieren inferencia y acciones de varios pasos.

Takeaways, Limitations

Takeaways:
Proponemos un enfoque novedoso para superar las limitaciones del lenguaje y resolver las dificultades del aprendizaje por transferencia al utilizar LLM como una capa de interfaz para el control de robots.
Al aprovechar los códigos latentes que se pueden aprender para permitir una comunicación eficiente entre LLM y las políticas de bajo nivel, mejoramos la capacidad de realizar tareas complejas de varios pasos.
Demostró un rendimiento superior en tareas que requieren inferencia y operaciones de múltiples pasos que los métodos existentes basados ​​en LLM.
Limitations:
Se necesitan más estudios para investigar el rendimiento de generalización del método LCB propuesto.
Se requiere una mayor verificación de su aplicabilidad a diversas plataformas y tareas robóticas.
Pueden requerirse estudios de optimización sobre la dimensionalidad y el método de aprendizaje de códigos latentes.
👍