PRIX (Plan a partir de Píxeles Sin Procesar) es una arquitectura integral y eficiente que predice rutas seguras para la conducción autónoma utilizando únicamente datos de cámara. Elimina la dependencia de los costosos sensores LiDAR tradicionales y de las representaciones de características de vehículos autónomos (BEV) de alto consumo computacional, y aprovecha un extractor de características visuales y un cabezal de planificación generativa para predecir rutas seguras directamente a partir de la información de píxeles sin procesar. Su componente principal, el Transformador de Recalibración Consciente del Contexto (CaRT), mejora eficazmente las características visuales en múltiples niveles para permitir una planificación más robusta. Alcanza un rendimiento de vanguardia en las pruebas de referencia de NavSim y nuScenes, y es comparable a planificadores de difusión multimodales de mayor tamaño, a la vez que es mucho más eficiente en términos de velocidad de inferencia y tamaño del modelo. Esto lo convierte en una solución práctica, ideal para implementaciones en el mundo real.