Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
Une méthode MCTS de mise à jour parallèle basée sur la valeur pour la prise de décision coopérative multi-agents des véhicules connectés et automatisés
Cet article propose une méthode de recherche arborescente de Monte-Carlo (MCTS) avec mises à jour parallèles pour un jeu de Markov multi-agents avec un horizon limité et un paramètre d'actualisation temporelle afin de résoudre des problèmes de prise de décision collaborative latérale et longitudinale dans la conduite coopérative multi-véhicules de véhicules connectés et automatisés (VAC). En analysant les comportements parallèles dans l'espace d'action collaborative multi-véhicules sous un flux de trafic partiellement stationnaire, la méthode de mise à jour parallèle augmente la profondeur de recherche sans sacrifier l'étendue de la recherche en excluant rapidement les actions potentiellement risquées. La méthode proposée est testée sur plusieurs flux de trafic générés aléatoirement, et les résultats expérimentaux démontrent une excellente robustesse et surpassent les algorithmes d'apprentissage par renforcement et les méthodes heuristiques de pointe. La stratégie de conduite du véhicule utilisant l'algorithme proposé démontre une rationalité supérieure à celle des conducteurs humains et améliore l'efficacité et la sécurité du trafic dans les zones de coordination.
Takeaways, Limitations
•
Takeaways:
◦
Nous présentons une méthode de mise à jour parallèle basée sur MCTS qui est efficace pour les jeux Markov multi-agents avec des paramètres d'horizon et de remise de temps limités.
◦
A démontré des performances et une robustesse supérieures par rapport aux algorithmes d’apprentissage par renforcement et aux méthodes heuristiques existants.
◦
Présentation de stratégies de conduite rationnelle de véhicules qui surpassent les conducteurs humains et améliorent l'efficacité et la sécurité du trafic.
•
Limitations:
◦
Manque de vérification de l’application de l’algorithme proposé aux environnements routiers réels.
◦
La vérification des performances de généralisation est requise pour diverses situations de circulation et environnements routiers complexes.
◦
Des recherches supplémentaires sont nécessaires sur la complexité de calcul de l’algorithme et son potentiel de traitement en temps réel.