Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

QuadKAN : Contrôle du mouvement des quadrupèdes amélioré par KAN via l'apprentissage par renforcement de bout en bout

Created by
  • Haebom

Auteur

Yinuo Wang, Gavin Tao

Contour

Cet article aborde le contrôle de robots quadrupèdes guidés par la vision par apprentissage par renforcement (RL), en insistant sur l'intégration essentielle de la proprioception et de la vision pour un contrôle robuste. Nous proposons QuadKAN, une stratégie intermodale paramétrée par splines utilisant les réseaux de Kolmogorov-Arnold (KAN). QuadKAN intègre un encodeur spline pour la proprioception et une tête de fusion spline pour les informations proprioceptives-visuelles. Cette classe structurée de fonctions aligne la correspondance état-action sur la fluidité de la marche par morceaux, améliorant ainsi l'efficacité de l'échantillonnage, réduisant les tremblements et la consommation d'énergie, et offrant une sensibilité pose-action interprétable. Nous utilisons la randomisation multimodale à retard (MMDR) et effectuons un apprentissage de bout en bout avec l'optimisation de la stratégie proximale (PPO). Les résultats d'évaluation sur divers terrains, y compris des surfaces uniformes et irrégulières et des scénarios avec obstacles statiques et dynamiques, démontrent que QuadKAN obtient systématiquement des rendements supérieurs, des distances de déplacement plus longues et moins de collisions que les modèles de référence de pointe (SOTA). Ces résultats démontrent que les politiques paramétrées par spline sont une alternative simple, efficace et interprétable pour une marche guidée par la vision robuste.

Takeaways, Limitations

Takeaways:
Nous démontrons expérimentalement qu'une politique intermodale paramétrée par spline (QuadKAN) améliore la robustesse et l'efficacité du contrôle de robot quadrupède guidé par la vision.
Nous confirmons que la combinaison d’informations proprioceptives et visuelles est importante pour un contrôle robuste des robots marcheurs quadrupèdes.
La paramétrisation des splines permet d'augmenter l'efficacité des échantillons, de réduire les tremblements comportementaux, de réduire la consommation d'énergie et d'améliorer l'interprétabilité.
Atteindre des performances de pointe sur une variété de terrains.
Limitations:
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de la méthode proposée.
Les résultats expérimentaux sur des robots réels ne sont pas encore présentés (référentiel à rendre public).
Une analyse approfondie des performances dans des environnements spécifiques est requise.
👍