Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

VolleyBots : un banc d'essai pour un jeu de volley-ball multi-drones combinant contrôle des mouvements et jeu stratégique

Created by
  • Haebom

Auteur

Zelai Xu, Ruize Zhang, Chao Yu, Huining Yuan, Xiangmin Yi, Shilong Ji, Chuqi Wang, Wenhao Tang, Feng Gao, Wenbo Ding, Xinlei Chen, Yu Wang

Contour

Cet article présente VolleyBots, un banc d'essai robotique sportif où plusieurs drones coopèrent et s'affrontent lors d'une partie de volley-ball. VolleyBots est une plateforme intégrant trois fonctionnalités : un gameplay compétitif et coopératif, une structure d'interaction au tour par tour et des manœuvres 3D agiles. Les drones doivent se coordonner avec leurs coéquipiers et anticiper et réagir aux tactiques de l'équipe adverse. L'interaction au tour par tour exige un timing précis, une prédiction d'état précise et une gestion des dépendances temporelles à long terme, tandis que les manœuvres 3D agiles nécessitent une accélération rapide, des virages serrés et un positionnement 3D précis malgré l'absence de commande de quadrirotor. Dans cet article, nous présentons un ensemble complet de tâches allant de l'entraînement monodrone aux tâches de coopération et de compétition multidrones, ainsi qu'une évaluation de base d'algorithmes représentatifs d'apprentissage par renforcement multi-agents (MARL) et de théorie des jeux. Les résultats de simulation montrent que les méthodes d'apprentissage par renforcement (RL) avec stratégie surpassent les méthodes hors stratégie dans les tâches mono-agent, mais que les deux méthodes peinent à s'adapter aux tâches complexes combinant contrôle moteur et jeu stratégique. Nous concevons également une politique hiérarchique qui atteint un taux de victoire de 69,5 % par rapport à la ligne de base la plus forte dans une tâche 3v3, soulignant son potentiel en tant que solution efficace pour aborder l'interaction complexe entre le contrôle de bas niveau et la stratégie de haut niveau.

Takeaways, Limitations

Takeaways:
Nous présentons VolleyBots, un nouveau banc d'essai pour évaluer l'intelligence mis en œuvre à travers les sports robotiques.
Démontre le potentiel des politiques hiérarchiques comme solution efficace aux problèmes complexes combinant contrôle moteur et jeu stratégique.
Les méthodes RL conformes aux politiques surpassent les tâches à agent unique.
Limitations:
Les méthodes RL, qu'elles soient conformes ou non à la politique, peinent à gérer des tâches complexes qui combinent contrôle moteur et jeu stratégique.
Présentation des résultats dans un environnement simulé plutôt que dans un environnement réel.
Des recherches supplémentaires sont nécessaires pour déterminer si la politique hiérarchique proposée est efficace dans toutes les situations complexes.
👍