[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

HeCoFuse: Percepción cooperativa V2X complementaria intermodal con sensores heterogéneos

Created by
  • Haebom

Autor

Chuheng Wei, Ziye Qin, Walter Zimmer, Guoyuan Wu, Matthew J. Barth

Describir

En este artículo, proponemos un marco integrado llamado HeCoFuse para abordar los desafíos de los sistemas de percepción cooperativa de vehículo a todo (V2X) del mundo real que operan en configuraciones de sensores heterogéneas. HeCoFuse está diseñado para la percepción cooperativa en diversas configuraciones de sensores, incluyendo nodos que utilizan tanto cámaras (C) como lidars (L). Introducimos un mecanismo de fusión jerárquica que pondera adaptativamente las características mediante una combinación de atención espacial y por canal para abordar problemas como la desalineación y la calidad de representación desequilibrada de las características multimodales. Además, empleamos un módulo de ajuste adaptativo de la resolución espacial para equilibrar el coste computacional y la eficiencia de la fusión. Para mejorar la robustez frente a diversas configuraciones, implementamos una estrategia de aprendizaje colaborativo que ajusta dinámicamente el tipo de fusión en función de las modalidades disponibles. Los resultados experimentales del conjunto de datos TUMTraf-V2X en condiciones reales muestran que HeCoFuse alcanza un 43,22 % de mAP 3D para todas las configuraciones de sensor (LC+LC), superando el valor de referencia de CoopDet3D en un 1,17 %, y alcanza un 43,38 % de mAP 3D en el escenario L+LC. También ocupa el primer puesto en el desafío DriveX de CVPR 2025, manteniendo entre el 21,74 % y el 43,38 % de mAP 3D en nueve configuraciones de sensor heterogéneas.

Takeaways, Limitations

Takeaways:
Presentamos HeCoFuse, un marco integrado eficaz para la percepción cooperativa V2X en configuraciones de sensores heterogéneos.
Logre un rendimiento sólido en una variedad de configuraciones de sensores a través de mecanismos de fusión jerárquica y módulos de ajuste de resolución espacial adaptativa.
Logró un rendimiento de última generación en el conjunto de datos TUMTraf-V2X y ganó el primer lugar en el CVPR 2025 DriveX Challenge.
Demuestra un excelente rendimiento robusto en diversos entornos de implementación de sensores.
Limitations:
Limitado a la evaluación del rendimiento en el conjunto de datos TUMTraf-V2X, el rendimiento de generalización a otros conjuntos de datos requiere validación adicional.
Existe la posibilidad de que no refleje perfectamente la complejidad del entorno vial real.
Se necesita más investigación sobre el análisis detallado de los costos computacionales y las estrategias de optimización.
👍