Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

QuadKAN: Control de movimiento cuadrúpedo mejorado con KAN mediante aprendizaje de refuerzo de extremo a extremo

Created by
  • Haebom

Autor

Yinuo Wang, Gavin Tao

Describir

Este artículo aborda el control de robots cuadrúpedos guiados por visión mediante aprendizaje por refuerzo (RL), haciendo hincapié en la integración esencial de la propiocepción y la visión para un control robusto. Proponemos QuadKAN, una política intermodal parametrizada por splines que utiliza redes de Kolmogorov-Arnold (KAN). QuadKAN integra un codificador de splines para la propiocepción y un cabezal de fusión de splines para la información propioceptiva-visual. Esta clase estructurada de funciones alinea la asignación de estado-acción con la suavidad de la marcha por partes, mejorando la eficiencia de la muestra, reduciendo el temblor de acción y el consumo de energía, y proporcionando una sensibilidad interpretable entre la postura y la acción. Empleamos la aleatorización de retardo multimodal (MMDR) y realizamos aprendizaje de extremo a extremo con optimización de política proximal (PPO). Los resultados de la evaluación en diversos terrenos, incluyendo superficies uniformes e irregulares y escenarios con obstáculos estáticos y dinámicos, demuestran que QuadKAN logra consistentemente mayores retornos, mayores distancias de recorrido y menos colisiones que los modelos de referencia de última generación (SOTA). Estos resultados demuestran que las políticas parametrizadas por splines son una alternativa simple, efectiva e interpretable para una caminata robusta guiada por visión.

Takeaways, Limitations

Takeaways:
Demostramos experimentalmente que una política intermodal parametrizada por spline (QuadKAN) mejora la robustez y la eficiencia del control de robots cuadrúpedos guiados por visión.
Confirmamos que la combinación de información propioceptiva y visual es importante para un control robusto de robots cuadrúpedos que caminan.
La parametrización de splines logra una mayor eficiencia de la muestra, una reducción del temblor de comportamiento, una reducción del consumo de energía y una mejor interpretabilidad.
Logrando un rendimiento de vanguardia en una variedad de terrenos.
Limitations:
Se necesita más investigación sobre el rendimiento de generalización del método propuesto.
Aún no se han presentado resultados experimentales en robots reales (el repositorio se hará público).
Se requiere un análisis en profundidad del rendimiento en entornos específicos.
👍