Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Aprendizaje robusto de imitación fuera de línea mediante la unión de trayectorias a nivel estatal

Created by
  • Haebom

Autor

Shuze Wang, Yunpeng Mei, Hongjie Cao, Yetian Yuan, Gang Wang, Jian Sun, Jie Chen

Describir

Este artículo presenta un método de aprendizaje interactivo fuera de línea que aprovecha datos de baja calidad y sin etiquetar para abordar la falta de datos expertos de alta calidad y el cambio de covariables en el aprendizaje por imitación (AI). En concreto, introducimos un marco de búsqueda basado en estados que conecta pares estado-acción a partir de datos de demostración incompletos, generando rutas de entrenamiento diversas y ricas en información. Los resultados experimentales demuestran que el método propuesto mejora significativamente la generalización y el rendimiento en pruebas de referencia estándar de AI y tareas robóticas del mundo real.

Takeaways, Limitations

Takeaways:
Presentamos un método novedoso para mejorar la eficiencia de los datos del aprendizaje por imitación aprovechando datos de baja calidad.
El marco de recuperación basado en estados permite la generación de datos de entrenamiento más diversos y ricos en información.
Demostrar practicidad mediante la verificación de mejoras de rendimiento en tareas robóticas reales.
Limitations:
Las mejoras de rendimiento del método propuesto pueden limitarse a puntos de referencia y tareas robóticas específicas.
Los marcos de búsqueda basados ​​en estados pueden ser computacionalmente costosos.
Es posible que falten evaluaciones del desempeño de generalización en varios tipos de datos de baja calidad.
👍