Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

De la Tabula Rasa a las Habilidades Emergentes: Descubrimiento de las Habilidades de los Robots a través de la Diversidad de Calidad No Supervisada en el Mundo Real

Created by
  • Haebom

Autor

Luca Grillotti (AIRL, Imperial College de Londres), Lisa Coiffard (AIRL, Imperial College de Londres), Oscar Pang (AIRL, Imperial College de Londres), Maxence Faldor (AIRL, Imperial College de Londres), Antoine Cully (AIRL, Imperial College de Londres)

Describir

Este artículo se centra en el descubrimiento autónomo de habilidades, donde los robots adquieren diversos comportamientos sin supervisión explícita. Los métodos existentes de Actor-Crítico de Calidad-Diversidad (QDAC) se basan en espacios de habilidades definidos manualmente y heurísticas cuidadosamente ajustadas, lo que limita su aplicabilidad en situaciones del mundo real. En este artículo, proponemos la Adquisición de Habilidades en el Mundo Real No Supervisada (URSA), una extensión de QDAC. URSA permite a los robots descubrir y dominar de forma autónoma diversas habilidades de alto rendimiento en el mundo real. A través de simulaciones y experimentos en el mundo real con el robot cuadrúpedo Unitree A1, demostramos el descubrimiento exitoso de diversas habilidades de locomoción, apoyando tanto el descubrimiento de habilidades basado en heurísticas como los entornos de aprendizaje completamente no supervisados. Además, al reutilizar el conjunto de habilidades aprendidas para tareas posteriores, como la adaptación a daños en el mundo real, demostramos que URSA supera a los métodos existentes en cinco de nueve escenarios de simulación y tres de cinco escenarios del mundo real. Esto presenta un nuevo marco para el aprendizaje robótico en el mundo real que permite el descubrimiento continuo de tecnología con intervención humana limitada, lo que marca un paso importante hacia sistemas robóticos más autónomos y adaptables.

Takeaways, Limitations

Takeaways:
Se presenta un nuevo marco para el descubrimiento y dominio de habilidades autónomas de robots en el mundo real (URSA).
Resolver los problemas de definición manual y ajuste heurístico que son limitaciones de los métodos QDAC existentes.
Admite entornos de aprendizaje tanto basados ​​en heurística como totalmente no supervisados.
Se demostró un rendimiento superior en comparación con los métodos existentes en tareas posteriores, como la adaptación a daños en el mundo real.
El descubrimiento tecnológico continuo es posible con una intervención humana limitada.
Presentación de resultados experimentales utilizando un robot real (Unitree A1).
Limitations:
Se necesita una mayor validación del rendimiento de generalización de URSA (evaluación del rendimiento en varias plataformas y entornos de robots).
La revisión de escalabilidad es necesaria para tareas complejas o descubrimientos tecnológicos más diversos.
La evaluación de robustez es necesaria para situaciones inesperadas que puedan ocurrir en aplicaciones del mundo real.
Se necesita investigación para mejorar la eficiencia del proceso de aprendizaje y acortar el tiempo de aprendizaje.
👍