Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

PRIX: Aprendiendo a planificar desde cero para la conducción autónoma de extremo a extremo

Created by
  • Haebom

Autor

Maciej K. Wozniak, Lianhang Liu, Yixi Cai, Patric Jensfelt

Describir

PRIX (Plan a partir de Píxeles Sin Procesar) es una arquitectura integral y eficiente que predice rutas seguras para la conducción autónoma utilizando únicamente datos de cámara. Elimina la dependencia de modelos a gran escala existentes, costosos sensores LiDAR y representaciones de características BEV (Vista Aérea) de alto consumo computacional. Además, utiliza un cabezal de planificación generativo y un extractor de características visuales que predicen rutas directamente a partir de la información de píxeles sin procesar. El componente principal, el Transformador de Recalibración Consciente del Contexto (CaRT), mejora eficazmente las características visuales multinivel para permitir una planificación más robusta. Alcanza un rendimiento de vanguardia en las pruebas de referencia de NavSim y nuScenes, y es comparable a los modelos de planificación de difusión multimodal a gran escala, además de ser mucho más eficiente en términos de velocidad de inferencia y tamaño del modelo. Por lo tanto, se evalúa como una solución práctica y adecuada para su implementación en el mundo real. El código fuente se publicará próximamente.

Takeaways, Limitations

Takeaways:
Demuestra la conducción autónoma de extremo a extremo utilizando solo cámaras, sin depender de LiDAR.
Consiga un rendimiento excelente sin representación BEV y reduzca los costos computacionales.
Un modelo ligero adecuado para su implementación en entornos reales.
Logrando un rendimiento de vanguardia.
Versión de código abierto para mejorar la accesibilidad.
Limitations:
Además del rendimiento comparativo de NavSim y nuScenes, se necesita verificar el rendimiento en otros conjuntos de datos o entornos reales.
Se necesitan más investigaciones sobre el rendimiento de generalización del módulo CaRT y su adaptabilidad a diversos entornos.
Se requiere una verificación de robustez frente a la complejidad e imprevisibilidad de los entornos viales reales.
👍