Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Un método MCTS de actualización paralela basado en valores para la toma de decisiones cooperativas entre múltiples agentes de vehículos conectados y automatizados

Created by
  • Haebom

Autor

Ye Han, Lijun Zhang, Dejian Meng, Zhuang Zhang, Xingyu Hu, Songyu Weng

Describir

Este artículo propone un método de búsqueda de árbol de Monte Carlo (MCTS) con actualizaciones paralelas para un juego de Markov multiagente con horizonte limitado y descuento temporal, con el fin de resolver problemas de toma de decisiones colaborativa lateral y longitudinal en la conducción cooperativa multivehicular de vehículos conectados y automatizados (CAV). Mediante el análisis de comportamientos paralelos en el espacio de acción colaborativa multivehicular bajo un flujo de tráfico parcialmente estable, el método de actualización paralela aumenta la profundidad de búsqueda sin sacrificar la amplitud, excluyendo rápidamente acciones potencialmente riesgosas. El método propuesto se prueba en múltiples flujos de tráfico generados aleatoriamente, y los resultados experimentales demuestran una excelente robustez y superan a los algoritmos de aprendizaje por refuerzo y métodos heurísticos de última generación. La estrategia de conducción del vehículo que utiliza el algoritmo propuesto demuestra una racionalidad superior a la de los conductores humanos y mejora la eficiencia y la seguridad del tráfico en zonas de coordinación.

Takeaways, Limitations

Takeaways:
Presentamos un método de actualización paralela basado en MCTS que es eficaz para juegos de Markov de múltiples agentes con configuraciones de descuento temporal y de horizonte limitado.
Se demostró un rendimiento y una solidez superiores a los algoritmos de aprendizaje de refuerzo y los métodos heurísticos existentes.
Presentar estrategias racionales de conducción de vehículos que superen a los conductores humanos y mejoren la eficiencia y la seguridad del tráfico.
Limitations:
Falta de verificación de la aplicación del algoritmo propuesto a entornos viales reales.
La verificación del rendimiento de generalización es necesaria para diversas situaciones de tráfico y entornos viales complejos.
Se necesita más investigación sobre la complejidad computacional del algoritmo y el potencial de procesamiento en tiempo real.
👍