Bài báo này đề xuất Driver-Net, một khuôn khổ học sâu mới có khả năng đánh giá chính xác và kịp thời mức độ sẵn sàng của người lái xe để đảm bảo chuyển giao quyền điều khiển an toàn trong xe tự hành. Không giống như các hệ thống giám sát người lái xe dựa trên tầm nhìn thông thường tập trung vào tư thế đầu hoặc ánh mắt, Driver-Net sử dụng ba camera để đồng bộ hóa và ghi lại các tín hiệu thị giác như đầu, tay và tư thế của người lái xe. Nó tích hợp dữ liệu không gian-thời gian thông qua kiến trúc đường dẫn kép bao gồm các khối ngữ cảnh và khối đặc trưng, đồng thời sử dụng chiến lược hợp nhất đa phương thức để nâng cao độ chính xác của dự đoán. Kết quả đánh giá sử dụng bộ dữ liệu đa dạng được thu thập từ Trình mô phỏng lái xe của Đại học Leeds cho thấy độ chính xác tối đa là 95,8% trong phân loại mức độ sẵn sàng của người lái xe. Điều này thể hiện sự cải tiến đáng kể so với các phương pháp hiện có và nhấn mạnh tầm quan trọng của việc hợp nhất đa phương thức và đa góc nhìn. Là một giải pháp không xâm lấn, thời gian thực, Driver-Net đóng góp đáng kể vào việc phát triển các phương tiện tự hành an toàn hơn và đáng tin cậy hơn, đáp ứng các quy định mới nổi và các tiêu chuẩn an toàn trong tương lai.