PRIX (Plan from Raw Pixels) là một kiến trúc đầu cuối hiệu quả, dự đoán đường đi an toàn cho xe tự hành chỉ bằng dữ liệu camera. Kiến trúc này loại bỏ sự phụ thuộc vào các cảm biến LiDAR truyền thống đắt tiền và các biểu diễn đặc trưng BEV tốn kém về mặt tính toán, đồng thời tận dụng bộ trích xuất đặc trưng trực quan và đầu lập kế hoạch tạo sinh để dự đoán đường đi an toàn trực tiếp từ dữ liệu pixel thô. Thành phần cốt lõi của kiến trúc này, Bộ chuyển đổi hiệu chuẩn lại nhận biết ngữ cảnh (CaRT), cải thiện hiệu quả các đặc trưng trực quan ở nhiều cấp độ, cho phép lập kế hoạch mạnh mẽ hơn. Kiến trúc này đạt hiệu suất tiên tiến trên các chuẩn mực NavSim và nuScenes, và tương đương với các bộ lập kế hoạch khuếch tán đa phương thức lớn hơn, đồng thời hiệu quả hơn nhiều về tốc độ suy luận và kích thước mô hình. Điều này khiến nó trở thành một giải pháp thiết thực, phù hợp cho việc triển khai trong thực tế.