Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

RALLY: Navegación adaptativa basada en LLM para enjambres de UAV con agentes

Created by
  • Haebom

Autor

Ziyao Wang, Rongpeng Li, Sizhao Li, Yuming Xiang, Haiping Wang, Zhifeng Zhao, Honggang Zhang

Describir

Este artículo se centra en el control inteligente de múltiples enjambres de vehículos aéreos no tripulados (UAV). Los enfoques existentes de aprendizaje por refuerzo multiagente (MARL) presentan una generalización deficiente y una escalabilidad limitada debido a las diferencias semánticas en la comunicación numérica y a la rigidez de una estructura de roles homogénea. Sin embargo, los marcos de control recientes basados ​​en modelos de lenguaje a gran escala (LLM) demuestran potentes capacidades de inferencia semántica al aprovechar un amplio conocimiento previo. Sin embargo, presentan dificultades para una navegación efectiva debido a un aprendizaje en línea insuficiente y a una dependencia excesiva del conocimiento previo estático. Para abordar estas limitaciones, este artículo propone RALLY, un algoritmo de navegación interactiva basado en LLM adaptativo a roles. RALLY mejora el rendimiento de la navegación colaborativa de sistemas multi-UAV mediante un marco de toma de decisiones semánticas basado en LLM que utiliza lenguaje natural estructurado, un mecanismo dinámico de heterogeneidad de roles para el cambio de roles y la toma de decisiones personalizada, y una estrategia de asignación de roles basada en RMIX que integra el conocimiento previo offline de LLM con las políticas online de MARL. Los resultados experimentales en plataformas de entorno de partículas multiagente (MPE) y software-in-the-loop (SITL) demuestran que RALLY supera a los métodos existentes en cobertura de tareas, velocidad de convergencia y rendimiento de generalización.

Takeaways, Limitations

Takeaways:
Mejorar la eficiencia y el rendimiento del control de enjambre de UAV a través de la comunicación semántica y el razonamiento colaborativo utilizando LLM.
Mejora del desempeño de las tareas a través del cambio de roles adaptativo y la toma de decisiones personalizada mediante mecanismos dinámicos de heterogeneidad de roles.
Integre eficazmente el conocimiento previo fuera de línea y el aprendizaje en línea a través de la estrategia de asignación de roles basada en RMIX.
La superioridad de RALLY se verificó mediante experimentos en entornos MPE y SITL.
Se presenta un nuevo enfoque para la navegación colaborativa de múltiples sistemas UAV.
Limitations:
Es necesaria una mayor verificación de la aplicación del algoritmo propuesto en entornos reales.
Es necesario tener en cuenta el coste computacional y el tiempo de procesamiento del LLM.
La evaluación del desempeño de generalización es necesaria para entornos y tareas más complejos y diversos.
Se necesita más investigación sobre el diseño y la optimización de la red RMIX.
👍