Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Aprendizaje del agarre diestro adaptativo a partir de demostraciones individuales

Created by
  • Haebom

Autor

Liangzhi Shi, Yulin Liu, Lingqi Zeng, Bo Ai, Zhengdong Hong, Hao Su

Describir

AdaDexGrasp es un marco que aprende eficientemente técnicas de agarre especializadas a partir de demostraciones humanas limitadas y las aplica adaptativamente según las instrucciones del usuario. Aprende múltiples técnicas de agarre a partir de una sola demostración humana y selecciona la más adecuada mediante un modelo de visión-lenguaje (VLM). Para aumentar la eficiencia de la muestra, propone una recompensa por seguimiento de trayectoria que guía el aprendizaje por refuerzo (RL) hacia un estado más cercano a las demostraciones humanas. También aprende más allá de una sola demostración mediante el aprendizaje curricular, que incrementa progresivamente el número de variaciones de la postura de los objetos. Tras su implementación, el VLM busca las técnicas adecuadas según las instrucciones del usuario, conectando las técnicas de aprendizaje de bajo nivel con la intención de alto nivel. Las evaluaciones en simulaciones y entornos reales demuestran que mejora significativamente la eficiencia del RL y permite el aprendizaje de estrategias de agarre similares a las humanas en diversas configuraciones de objetos. La transferencia inmediata de la política aprendida a la PSYONIC Ability Hand real alcanza una tasa de éxito del 90 % en los objetos, superando significativamente el rendimiento base.

Takeaways, Limitations

Takeaways:
Las habilidades y destrezas de los fagos se pueden aprender a partir de demostraciones humanas limitadas.
Reflejar la intención de alto nivel a través de la selección de tecnología basada en el contexto utilizando modelos de lenguaje-visión.
Aprendizaje robusto de habilidades y generalización a través del aprendizaje curricular.
Transferencia exitosa de disparo cero a la mano del robot real.
Aprendiendo estrategias de fagos similares a las humanas.
Limitations:
Falta de descripción detallada de la estructura específica y el rendimiento del VLM propuesto.
Limitaciones en el rendimiento de generalización en una variedad de objetos y situaciones.
Se requieren pruebas y validaciones adicionales en entornos del mundo real.
Falta de discusión sobre el establecimiento de parámetros óptimos para la compensación del seguimiento de trayectoria.
👍