Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

V2X-UniPool: Unificación de la percepción multimodal y el razonamiento del conocimiento para la conducción autónoma

Created by
  • Haebom

Autor

Xuewen Luo, Fengze Yang, Fan Ding, Xiangbo Gao, Shuo Xing, Yang Zhou, Zhengzhong Tu, Chenxi Liu

Describir

Para abordar las limitaciones cognitivas derivadas de un único sensor vehicular y el problema de la ilusión óptica debido a la falta de infraestructura ambiental en tiempo real, este artículo presenta V2X-UniPool, un marco integrado que integra datos multimodales de vehículo a todo (V2X) en un conjunto de conocimientos indexado temporalmente y basado en lenguaje. Aprovechando un mecanismo de generación aumentada (RAG) de doble consulta que permite la recuperación de conocimiento estático y dinámico, el sistema realiza inferencias precisas y consistentes temporalmente tanto en entornos estáticos como en situaciones de tráfico dinámico. Los resultados experimentales con conjuntos de datos reales de conducción cooperativa demuestran que V2X-UniPool mejora significativamente la precisión de la planificación del movimiento y la capacidad de inferencia, y alcanza un rendimiento de vanguardia en modelos de vehículo de disparo cero, a la vez que reduce los costos de transmisión en más del 99,9 % en comparación con los enfoques V2X convencionales.

Takeaways, Limitations

Takeaways:
Integración eficaz de datos V2X para mejorar las capacidades de percepción y razonamiento de los sistemas de conducción autónoma
Aprovechar la indexación temporal y los grupos de conocimiento basados ​​en el lenguaje para lograr una inferencia consistente en el tiempo
Utilización eficiente del conocimiento estático y dinámico mediante el mecanismo RAG de consulta dual
Lograr un rendimiento de vanguardia y reducir drásticamente los costos de transmisión incluso en modelos de disparo cero
Limitations:
Se necesita una validación adicional del rendimiento de generalización en entornos viales reales.
Se necesita una evaluación de robustez para varios entornos de comunicación V2X y retrasos en la comunicación
Se necesita un análisis adicional sobre la escalabilidad y el rendimiento del procesamiento en tiempo real de V2X-UniPool
Es necesario considerar la dependencia de conjuntos de datos específicos y la generalización a otros conjuntos de datos.
👍