PRIX (Plan from Raw Pixels) là một kiến trúc đầu cuối hiệu quả, dự đoán đường đi an toàn cho xe tự hành chỉ bằng dữ liệu camera. Kiến trúc này loại bỏ sự phụ thuộc vào các mô hình quy mô lớn hiện có, cảm biến LiDAR đắt tiền và các biểu diễn đặc trưng BEV (Bird's Eye View) tốn nhiều tài nguyên tính toán, đồng thời sử dụng đầu lập kế hoạch tạo sinh và trình trích xuất đặc trưng trực quan để dự đoán đường đi trực tiếp từ các đầu vào pixel thô. Thành phần cốt lõi, Bộ chuyển đổi hiệu chuẩn lại nhận biết ngữ cảnh (CaRT), cải thiện hiệu quả các đặc trưng trực quan đa cấp, cho phép lập kế hoạch mạnh mẽ hơn. Kiến trúc này đạt hiệu suất tiên tiến trên các chuẩn mực NavSim và nuScenes, và tương đương với các mô hình lập kế hoạch khuếch tán đa phương thức quy mô lớn, đồng thời hiệu quả hơn nhiều về tốc độ suy luận và kích thước mô hình. Do đó, kiến trúc này được đánh giá là một giải pháp thiết thực, phù hợp để triển khai trong thực tế. Mã nguồn sẽ được phát hành.