Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

SpiderNets: Ước tính mức độ sợ hãi của hình ảnh liên quan đến nhện bằng mô hình thị giác

Created by
  • Haebom

Tác giả

Dominik Pegler, David Steyrl, Mengfan Zhang, Alexander Karner, Jozsef Arato, Frank Scharnowski, Filip Melinscak

Phác thảo

Bài báo này nghiên cứu liệu các mô hình thị giác máy tính được đào tạo trước có thể dự đoán chính xác mức độ sợ hãi trong các hình ảnh liên quan đến nhện hay không, cung cấp một nghiên cứu cơ bản để phát triển một hệ thống trị liệu tiếp xúc máy tính thích ứng. Sử dụng học chuyển giao, ba mô hình khác nhau đã được áp dụng để dự đoán mức độ sợ hãi của con người (trên thang điểm 0-100) từ một tập dữ liệu chuẩn hóa gồm 313 hình ảnh. Kết quả xác thực chéo cho thấy sai số tuyệt đối trung bình (MAE) là 10,1–11,0. Phân tích đường cong học tập cho thấy việc giảm kích thước tập dữ liệu dẫn đến giảm hiệu suất, nhưng việc tiếp tục tăng kích thước tập dữ liệu không cải thiện đáng kể hiệu suất. Đánh giá khả năng giải thích đã chứng minh rằng các dự đoán của mô hình dựa trên các đặc điểm liên quan đến nhện và phân tích lỗi theo danh mục đã xác định các điều kiện thị giác liên quan đến tỷ lệ lỗi cao, chẳng hạn như tầm nhìn xa và nhện nhân tạo/nhện được vẽ. Nghiên cứu này chứng minh tiềm năng của các mô hình thị giác máy tính có thể giải thích được đối với việc dự đoán mức độ sợ hãi và nhấn mạnh tầm quan trọng của khả năng giải thích của mô hình và kích thước tập dữ liệu đủ để phát triển liệu pháp nhận dạng cảm xúc hiệu quả.

Takeaways, Limitations

Takeaways:
Chúng tôi chứng minh rằng mô hình thị giác máy tính được đào tạo trước có thể được sử dụng để dự đoán mức độ sợ hãi.
Nó thể hiện tiềm năng đóng góp vào sự phát triển của các hệ thống trị liệu tiếp xúc với máy tính thích ứng.
Nhấn mạnh tầm quan trọng của việc đảm bảo khả năng giải thích của mô hình.
Xác nhận nhu cầu về kích thước tập dữ liệu đủ lớn.
Limitations:
Tỷ lệ lỗi tương đối cao của MAE 10.1~11.0.
Hiệu suất tổng quát có thể bị suy giảm do hạn chế về kích thước tập dữ liệu.
Tỷ lệ lỗi cao trong một số điều kiện thị giác nhất định (tầm nhìn xa, nhện nhân tạo/nhện sơn, v.v.).
Vì nghiên cứu chỉ giới hạn ở chứng sợ nhện nên khả năng khái quát hóa sang các chứng sợ khác bị hạn chế.
👍