Trong bài báo này, chúng tôi chỉ ra rằng các mô hình xe tự hành hiện có trên thế giới gặp khó khăn trong việc dự đoán và khái quát hóa dài hạn cho các tình huống khó khăn, và phát triển một mô hình đạt hiệu suất tuyệt vời mà không cần giám sát hoặc cảm biến bổ sung (ví dụ: bản đồ, độ sâu, nhiều camera, v.v.) thông qua các lựa chọn thiết kế đơn giản. Mặc dù chỉ có 469 triệu tham số được huấn luyện trên 280 giờ dữ liệu video, chúng tôi vẫn đạt được hiệu suất tiên tiến, đặc biệt là trong các tình huống khó khăn như chuyển hướng và giao thông đô thị. Ngoài ra, chúng tôi so sánh trực tiếp điểm mạnh và điểm yếu của mô hình liên tục dựa trên khớp luồng và mô hình mã thông báo rời rạc sử dụng bộ mã thông báo lai, và kết luận rằng mô hình tự hồi quy liên tục ít bị ảnh hưởng bởi các lựa chọn thiết kế riêng lẻ và mạnh mẽ hơn. Mã nguồn, mô hình và kết quả định tính được công bố công khai.