Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

SoccerDiffusion : Vers un apprentissage complet du football robotisé humanoïde à partir d'enregistrements de gameplay

Created by
  • Haebom

Auteur

Florian Vahl, J orn Griepenburg, Jan Gutsche, Jasper G uldenstein, Jianwei Zhang

Contour

SoccerDiffusion est un modèle de diffusion basé sur Transformer qui apprend des politiques de contrôle de bout en bout pour le football robotisé humanoïde à partir de données enregistrées lors de matchs réels de RoboCup. Il prédit les séquences de commandes articulaires à partir de divers capteurs, notamment la vision, la proprioception et l'état du jeu. Il réduit le processus de diffusion multi-étapes à une seule étape grâce à des techniques de distillation des connaissances pour une inférence en temps réel. Il démontre sa capacité à reproduire des comportements complexes tels que la marche, le coup de pied et la récupération après chute, aussi bien sur des simulations que sur des robots réels. Bien que ses comportements tactiques à haute dimension soient limités, il fournit une base solide pour les futures méthodes d'apprentissage par renforcement ou d'optimisation des préférences. L'ensemble de données, les modèles pré-entraînés et le code sont accessibles au public à l'adresse https://bit-bots.github.io/SoccerDiffusion .

Takeaways, Limitations

Takeaways:
Présentation de la possibilité d'apprendre la politique de contrôle du football par robot humanoïde en utilisant des données réelles de RoboCup.
Mise en œuvre de l’inférence en temps réel grâce à la distillation des connaissances.
Reproduction réussie de mouvements complexes tels que la marche, les coups de pied et la récupération après une chute.
Assurer la reproductibilité et l’évolutivité de la recherche grâce à la divulgation d’ensembles de données, de modèles et de codes.
Limitations:
Performances limitées pour les actions tactiques de haut niveau.
Des recherches supplémentaires sont nécessaires pour des actions tactiques d’ordre supérieur.
👍