Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Vers un football coopératif et compétitif dans le monde réel avec des équipes de robots quadrupèdes

Created by
  • Haebom

Auteur

Zhi Su, Yuman Gao, Emily Lukas, Yunfei Li, Jiaze Cai, Faris Tulbah, Fei Gao, Chao Yu, Zhongyu Li, Yi Wu, Koushil Sreenath

Contour

Cet article présente un cadre d'apprentissage par renforcement multi-agents hiérarchique (MARL) permettant de réaliser un travail d'équipe coopératif entre robots à pattes. En utilisant le football robotisé comme environnement de test, nous mettons en œuvre des interactions multi-agents dynamiques et compétitives. À un niveau bas, nous apprenons diverses compétences motrices, telles que la marche, le dribble et le coup de pied. À un niveau élevé, nous apprenons des politiques de planification stratégique grâce à l'optimisation multi-agents proximale (MAPPO) avec auto-jeu fictif (FSP). Cela permet aux agents de s'adapter à diverses stratégies adverses et de démontrer des comportements d'équipe sophistiqués, tels que les passes coopératives, l'interception et le partage des rôles. Nous appliquons ce cadre à de vrais robots quadrupèdes pour réaliser des matchs de football autonomes entre robots et entre robots et humains, en intérieur comme en extérieur, en utilisant uniquement leur propre perception de la position.

Takeaways, Limitations

Takeaways:
Un cadre MARL efficace pour le travail d’équipe collaboratif de robots à pattes est présenté.
Atteindre des performances élevées grâce à l’intégration hiérarchique de technologies opérationnelles de bas niveau et à une planification stratégique de haut niveau.
Adaptabilité à diverses stratégies adverses et mise en œuvre de comportements d'équipe sophistiqués (passe, interception, répartition des rôles).
Vérification des performances dans des environnements réels grâce à des expériences utilisant des plates-formes robotiques réelles.
Limitations:
Le document manque de descriptions détaillées des paramètres environnementaux spécifiques (par exemple, les spécifications du robot, la taille de l’arène, etc.).
Manque d'analyse du coût de calcul et de la vitesse de convergence du processus d'apprentissage utilisant FSP.
Manque d’évaluation de la robustesse du robot face à divers facteurs externes (par exemple, terrain irrégulier, comportement imprévisible de l’adversaire).
Manque de considération pour la durée de vie de la batterie du robot et les problèmes de durabilité lors des matchs de longue durée.
👍