Trong bài báo này, chúng tôi trình bày RadGazeIntent, một phương pháp học sâu dựa trên học máy để mô hình hóa hành vi theo dõi ánh nhìn có chủ đích của các bác sĩ X quang. Để khắc phục những hạn chế của các mô hình hiện có trong việc nắm bắt ý định cơ bản của các điểm nhìn, chúng tôi sử dụng kiến trúc dựa trên bộ biến đổi để xử lý cả chiều thời gian và không gian của dữ liệu ánh nhìn. Chúng tôi chuyển đổi các đặc điểm điểm nhìn chi tiết thành các biểu diễn có ý nghĩa, chi tiết về các ý định chẩn đoán để diễn giải các mục tiêu của các bác sĩ X quang. Chúng tôi tạo ra ba tập con nhãn ý định: RadSeq (khám phá tuần tự có hệ thống), RadExplore (khám phá dựa trên sự không chắc chắn) và RadHybrid (các mẫu hỗn hợp) để nắm bắt các sắc thái của các hành vi dựa trên ý định đa dạng của các bác sĩ X quang. Kết quả thực nghiệm cho thấy RadGazeIntent vượt trội hơn các phương pháp cơ sở trên tất cả các tập dữ liệu nhãn ý định trong việc dự đoán những phát hiện mà các bác sĩ X quang đang xem xét tại một thời điểm nhất định.