Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Aprendizaje de la manipulación pivotante con retroalimentación de fuerza y visión mediante demostraciones basadas en optimización

Created by
  • Haebom

Autor

Yuki Shirai, Kei Ota, Devesh K. Jha, Diego Romeres

Describir

Este artículo presenta un nuevo marco que combina enfoques basados en modelos y aprendizaje para resolver el problema de la manipulación no prensil. Combinando la eficiencia de los enfoques basados en modelos con la robustez de los enfoques basados en aprendizaje, logramos un aprendizaje eficiente en muestras mediante el diseño de un aprendizaje de refuerzo profundo (RL) guiado por demostración, basado en la optimización de trayectoria implícita de contacto (CITO) computacionalmente eficiente, que considera explícitamente los puntos de contacto. Además, presentamos un enfoque de transferencia de simulación a realidad mediante una estrategia de entrenamiento privilegiada que permite a un robot realizar la manipulación de pivote utilizando únicamente propiocepción, visión y detección de fuerza, sin información privilegiada (p. ej., masa, tamaño o postura del objeto). La evaluación en múltiples tareas de pivote demuestra la implementación exitosa de la transferencia de simulación a realidad. Puede encontrar más detalles en el video disponible en el enlace de YouTube.

Takeaways, Limitations

Takeaways:
Al combinar las ventajas de los enfoques basados en modelos y aprendizaje, presentamos una solución eficiente y sólida al problema de manipulación sin contacto.
Consiga un aprendizaje eficiente en el uso de muestras utilizando CITO y RL guiado por demostraciones.
Presentamos un método para realizar con éxito transiciones de simulación a realidad sin información privilegiada.
Verificamos el rendimiento a través de resultados experimentales en un sistema de robot real.
Limitations:
Se necesitan más investigaciones para determinar el rendimiento de generalización del método propuesto.
Es necesario mejorar aún más la robustez frente a diversos entornos y objetos.
La dependencia de las estrategias de entrenamiento de privilegios puede limitar la escalabilidad del sistema.
👍