Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Un marco multiagente cooperativo en cascada para el control de fusión de rampas de acceso que integra modelos de lenguaje grandes

Created by
  • Haebom

Autor

Miao Zhang, Zhenlong Fang, Tianyi Wang, Qian Zhang, Shuai Lu, Junfeng Jiao, Tianyu Shi

Describir

En este artículo, proponemos un marco multiagente cooperativo jerárquico (CCMA) para abordar las limitaciones del aprendizaje por refuerzo (AR) convencional, como la dificultad para replicar comportamientos similares a los humanos, la generalización efectiva en entornos multiagente y los problemas de interpretabilidad. CCMA integra el AR para interacciones individuales entre agentes, un LLM optimizado para la cooperación local, una función de recompensa para la optimización global y un mecanismo de generación con búsqueda aumentada para la optimización dinámica de decisiones en escenarios de conducción complejos. Los resultados experimentales muestran que CCMA mejora significativamente el rendimiento a nivel micro y macro en entornos de conducción complejos, en comparación con los métodos de AR convencionales.

Takeaways, Limitations

Takeaways:
Se presenta un nuevo marco de colaboración entre múltiples agentes que supera los __T14911_____ del RL existente.
Mejora del rendimiento de colaboración y generalización de múltiples agentes mediante LLM
Rendimiento micro y macro mejorado en escenarios de conducción complejos
Optimización dinámica de decisiones mediante un mecanismo de generación de aumento de búsqueda
Limitations:
Se necesitan más investigaciones para determinar la aplicabilidad en el mundo real del marco propuesto.
Complejidad del ajuste fino y el diseño de la función de recompensa en LLM
Es necesaria una mayor validación de la generalización mediante la evaluación del rendimiento en entornos de conducción específicos.
Se necesita más investigación sobre la escalabilidad a otros sistemas multiagente.
👍