Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Khảo sát về Nhận dạng cử chỉ tay từ đầu vào trực quan

Created by
  • Haebom

Tác giả

Manousos Linardakis, Iraklis Varlamis, Georgios Th. Papadopoulos

Phác thảo

Bài báo này khảo sát toàn diện những tiến bộ gần đây trong nhận dạng cử chỉ tay và tư thế tay 3D từ nhiều nguồn dữ liệu camera khác nhau, bao gồm ảnh RGB, ảnh chiều sâu và video từ camera đơn sắc hoặc đa ống kính. Khảo sát này giải quyết vấn đề thiếu một khảo sát toàn diện về các xu hướng nghiên cứu gần đây, các giải pháp khả dụng và bộ dữ liệu chuẩn trong lĩnh vực nhận dạng cử chỉ tay đang ngày càng trở nên quan trọng do nhu cầu tương tác giữa người và máy tính ngày càng tăng. Chúng tôi xem xét các yêu cầu phương pháp luận khác nhau của các phương pháp tiếp cận khác nhau, cung cấp tổng quan về các bộ dữ liệu được sử dụng rộng rãi và trình bày chi tiết các đặc điểm chính cũng như lĩnh vực ứng dụng của chúng. Cuối cùng, chúng tôi nhấn mạnh những thách thức còn bỏ ngỏ, chẳng hạn như đạt được khả năng nhận dạng mạnh mẽ trong môi trường thực tế, xử lý hiện tượng che khuất, đảm bảo khả năng khái quát hóa trên nhiều người dùng khác nhau và giải quyết hiệu quả tính toán cho các ứng dụng thời gian thực, đồng thời đề xuất các hướng nghiên cứu trong tương lai.

Takeaways, Limitations

Takeaways:
Cung cấp tổng quan toàn diện về các xu hướng nghiên cứu mới nhất, các giải pháp khả dụng và bộ dữ liệu chuẩn trong lĩnh vực nhận dạng cử chỉ tay.
Chúng tôi phân tích các yêu cầu về phương pháp của từng cách tiếp cận đối với dữ liệu đầu vào của camera khác nhau (hình ảnh RGB, hình ảnh độ sâu và video).
Chúng tôi trình bày chi tiết các tính năng chính và lĩnh vực ứng dụng của các tập dữ liệu được sử dụng rộng rãi.
Chúng tôi đề xuất các hướng nghiên cứu trong tương lai cho các ứng dụng thực tế (xử lý tắc nghẽn, khái quát hóa cho nhiều người dùng khác nhau, hiệu quả xử lý thời gian thực, v.v.).
Limitations:
Bài báo này có thể không phản ánh xu hướng nghiên cứu sau khi xuất bản.
Có thể thiếu sự phân tích so sánh chuyên sâu về các thuật toán hoặc phương pháp cụ thể.
Có thể chúng tôi chưa đề cập đầy đủ đến tất cả các tập dữ liệu có liên quan.
👍