Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Planificador adaptativo latente para la manipulación dinámica

Created by
  • Haebom

Autor

Donghun Noh, Deqian Kong, Minglu Zhao, Andrew Lizárraga, Jianwen Xie, Ying Nian Wu, Dennis Hong

Describir

Este artículo presenta el Planificador Adaptativo Latente (LAP), una política basada en variables latentes para la manipulación dinámica sin contacto (p. ej., agarre de caja). LAP infiere planes en un espacio latente de baja dimensión y se entrena eficazmente mediante vídeos de demostración con humanos. Durante la ejecución, LAP mantiene las probabilidades posteriores del plan latente y realiza una replanificación variacional a medida que llegan nuevas observaciones, logrando una adaptación en tiempo real. Para reducir la brecha de implementación entre humanos y robots, introducimos un mapeo proporcional basado en modelos que recrea con precisión los estados cinemáticos de las articulaciones y las posiciones de los objetos a partir de demostraciones con humanos. Mediante desafiantes experimentos de agarre de caja con diversas propiedades de objetos, LAP aprende movimientos flexibles y comportamientos adaptativos similares a los humanos, demostrando excelentes tasas de éxito, suavidad de trayectoria y eficiencia energética. En general, LAP permite la manipulación dinámica mediante la adaptación en tiempo real y se transfiere con éxito entre plataformas robóticas heterogéneas utilizando los mismos vídeos de demostración con humanos.

Takeaways, Limitations

Takeaways:
La planificación basada en inferencias en espacios latentes de baja dimensión permite la adaptación en tiempo real y una manipulación dinámica y eficiente sin contacto.
Aprendizaje efectivo a través de videos de demostración humana y transferibilidad entre plataformas robóticas heterogéneas.
Reducir la brecha de implementación entre humanos y robots mediante el mapeo proporcional basado en modelos.
Lograr un rendimiento superior (tasa de éxito, suavidad de trayectoria, eficiencia energética) a través de un comportamiento obediente similar al humano y un aprendizaje de comportamiento adaptativo.
Limitations:
El documento carece de referencias específicas a Limitations o restricciones.
Se necesita una mayor validación del rendimiento de generalización en diversos entornos y objetos.
Necesidad de evaluar la dependencia de la cantidad y calidad de los datos de entrenamiento.
Se necesitan más experimentos para determinar la robustez en entornos del mundo real.
👍