Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

RAILGUN: Una política convolucional unificada para la búsqueda de rutas multiagente en diferentes entornos y tareas

Created by
  • Haebom

Autor

Yimin Tang, Xiao Xiong, Jingyi Xi, Jiaoyang Li, Erdem B{\i}y{\i}k, Sven Koenig

Describir

Este artículo presenta RAILGUN, la primera política centralizada basada en aprendizaje para el problema de búsqueda de rutas multiagente (MAPF). A diferencia de los métodos existentes basados en aprendizaje distribuido, RAILGUN utiliza una arquitectura basada en CNN para diseñar una política supervisada, lo que permite la generalización en una amplia gama de tamaños de mapas y números de agentes. El modelo se entrena mediante aprendizaje supervisado con datos de trayectoria recopilados mediante métodos basados en reglas. Amplios resultados experimentales demuestran que RAILGUN supera a los métodos existentes y logra un excelente rendimiento de generalización de disparo cero.

Takeaways, Limitations

Takeaways:
Presentamos la primera política basada en aprendizaje centralizado para el problema de búsqueda de rutas de múltiples agentes.
Demostrar generalización en diferentes tamaños de mapas y cantidades de agentes con políticas basadas en mapas.
Se ha verificado experimentalmente que el rendimiento de generalización de disparo cero es excelente.
Lograr un rendimiento superior en comparación con los métodos existentes
Limitations:
Confíe en enfoques de aprendizaje supervisado que utilicen datos recopilados mediante métodos basados en reglas.
Falta de descripción detallada de la arquitectura y el proceso de entrenamiento de RAILGUN (se necesita información adicional)
Falta de validación del rendimiento de generalización para otros tipos de problemas MAPF (por ejemplo, entornos dinámicos).
👍