Bài báo này nghiên cứu liệu các mô hình thị giác máy tính được đào tạo trước có thể dự đoán chính xác mức độ sợ hãi trong các hình ảnh liên quan đến nhện hay không, cung cấp một nghiên cứu cơ bản để phát triển một hệ thống trị liệu tiếp xúc máy tính thích ứng. Sử dụng học chuyển giao, ba mô hình khác nhau đã được áp dụng để dự đoán mức độ sợ hãi của con người (trên thang điểm 0-100) từ một tập dữ liệu chuẩn hóa gồm 313 hình ảnh. Kết quả xác thực chéo cho thấy sai số tuyệt đối trung bình (MAE) là 10,1–11,0. Phân tích đường cong học tập cho thấy việc giảm kích thước tập dữ liệu dẫn đến giảm hiệu suất, nhưng việc tiếp tục tăng kích thước tập dữ liệu không cải thiện đáng kể hiệu suất. Đánh giá khả năng giải thích đã chứng minh rằng các dự đoán của mô hình dựa trên các đặc điểm liên quan đến nhện và phân tích lỗi theo danh mục đã xác định các điều kiện thị giác liên quan đến tỷ lệ lỗi cao, chẳng hạn như tầm nhìn xa và nhện nhân tạo/nhện được vẽ. Nghiên cứu này chứng minh tiềm năng của các mô hình thị giác máy tính có thể giải thích được đối với việc dự đoán mức độ sợ hãi và nhấn mạnh tầm quan trọng của khả năng giải thích của mô hình và kích thước tập dữ liệu đủ để phát triển liệu pháp nhận dạng cảm xúc hiệu quả.