Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

De la Tabula Rasa a las Habilidades Emergentes: Descubrimiento de las Habilidades de los Robots a través de la Diversidad de Calidad No Supervisada en el Mundo Real

Created by
  • Haebom

Autor

Luca Grillotti (AIRL, Imperial College de Londres), Lisa Coiffard (AIRL, Imperial College de Londres), Oscar Pang (AIRL, Imperial College de Londres), Maxence Faldor (AIRL, Imperial College de Londres), Antoine Cully (AIRL, Imperial College de Londres)

Describir

Este artículo tiene como objetivo lograr el descubrimiento autónomo de habilidades, lo que permite a los robots adquirir diversos comportamientos sin supervisión explícita. Los métodos existentes de Actor-Crítico de Calidad-Diversidad (QDAC) requieren espacios de habilidades definidos manualmente y heurísticas cuidadosamente ajustadas, lo que limita su aplicación práctica. En este artículo, proponemos la Adquisición de Habilidades en el Mundo Real No Supervisada (URSA), una extensión de QDAC, que permite a los robots descubrir y dominar de forma autónoma diversas habilidades de alto rendimiento en entornos del mundo real. Demostramos que URSA descubre con éxito diversas habilidades de locomoción para el robot cuadrúpedo Unitree A1 tanto en entornos simulados como del mundo real. Admite tanto el descubrimiento de habilidades basado en heurísticas como entornos de aprendizaje completamente no supervisados, lo que demuestra que el conjunto de habilidades aprendidas se puede reutilizar para tareas posteriores, como la adaptación a daños en el mundo real. Demostramos que supera a los modelos de referencia en escenarios de daños del mundo real, presentando un marco novedoso para el aprendizaje de robots en el mundo real que permite el descubrimiento continuo de habilidades con intervención humana limitada.

Takeaways, Limitations

Takeaways:
Un nuevo marco para el descubrimiento y dominio de habilidades autónomas por parte de robots en entornos del mundo real.
Abordar la necesidad de definición del espacio de habilidades manuales y ajuste heurístico en Limitations de QDAC
Admite entornos de aprendizaje tanto basados ​​en heurística como totalmente no supervisados.
Prueba de la reutilización de las habilidades aprendidas en tareas posteriores, incluida la adaptación a daños en el mundo real.
Contribuye a mejorar la autonomía y adaptabilidad de los sistemas robóticos del mundo real.
Limitations:
Sólo se presentan resultados experimentales para el robot cuadrúpedo Unitree A1, y se necesita más investigación para determinar la generalización a otras plataformas de robot.
La escala y la diversidad de los experimentos en el mundo real pueden ser limitadas.
Debido a la naturaleza del aprendizaje no supervisado, existe la posibilidad de que haya problemas de imprevisibilidad y estabilidad en el proceso de aprendizaje.
👍