Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

X-Sim: Aprendizaje entre encarnaciones a través de Real-Sim-a-Real

Created by
  • Haebom

Autor

Prithwish Dan, Kushal Kedia, Angela Chao, Edward Weiyi Duan, Maximus Adrian Pace, Wei-Chiu Ma, Sanjiban Choudhury

Describir

Este artículo propone un marco de trabajo de simulación a real, denominado X-Sim. En lugar de imitar el movimiento humano, X-Sim extrae el movimiento de objetos de imágenes RGBD para definir recompensas centradas en objetos, que se utilizan para entrenar un agente de aprendizaje por refuerzo (RL). La política aprendida se destila en una política de difusión condicional a la imagen mediante despliegues sintéticos renderizados con diversos puntos de vista e iluminación. Para transferirla al entorno real, alineamos observaciones reales y simuladas mediante adaptación de dominio en línea. Demostramos una mejora promedio del 30 % en el rendimiento en cinco tareas de manipulación sin requerir datos de teleoperación robótica, logramos el mismo rendimiento con un tiempo de adquisición de datos diez veces menor que con los métodos existentes y demostramos una buena generalización a nuevos puntos de vista de cámara y tiempos de prueba.

Takeaways, Limitations

Takeaways:
Demostramos que es posible aprender políticas de manipulación de robots sin imitar el movimiento humano.
Mejora del rendimiento de transferencia de lo real a la simulación mediante compensación centrada en objetos.
Aumentar la aplicabilidad en el mundo real a través de técnicas de adaptación de dominio en línea.
Reducir el tiempo de recopilación de datos y mejorar el rendimiento de generalización.
Limitations:
Depende de los datos de imagen RGBD.
No es una solución perfecta para la brecha entre los entornos simulados y los reales.
El rendimiento de generalización a tareas distintas de las cinco tareas de manipulación presentadas requiere una validación adicional.
👍