Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Enquête sur la reconnaissance des gestes de la main à partir d'une entrée visuelle

Created by
  • Haebom

Auteur

Manousos Linardakis, Iraklis Varlamis, Georgios Th. Papadopoulos

Contour

Cet article passe en revue de manière exhaustive les avancées récentes en matière de reconnaissance des gestes de la main et de la posture 3D à partir de diverses entrées de caméra, notamment des images RVB, des images de profondeur et des vidéos provenant de caméras monoculaires ou multi-objectifs. Cette étude comble le manque d'une étude exhaustive couvrant les tendances récentes de la recherche, les solutions disponibles et les bases de données de référence dans un domaine de la reconnaissance des gestes de la main qui prend de l'importance en raison de la demande croissante d'interaction homme-machine. Nous examinons les différentes exigences méthodologiques des différentes approches, fournissons un aperçu des bases de données les plus utilisées et détaillons leurs principales caractéristiques et domaines d'application. Enfin, nous soulignons les défis à relever, tels que la réalisation d'une reconnaissance robuste en environnement réel, la gestion de l'occlusion, la généralisation à différents utilisateurs et l'amélioration de l'efficacité de calcul pour les applications temps réel, suggérant ainsi de futures pistes de recherche.

Takeaways, Limitations_

Takeaways:
Fournit un aperçu complet des dernières tendances de recherche, des solutions disponibles et des ensembles de données de référence dans le domaine de la reconnaissance des gestes de la main.
Nous analysons les exigences méthodologiques de chaque approche pour différentes données d’entrée de caméra (images RVB, images de profondeur et vidéos).
Nous détaillons les principales caractéristiques et domaines d’application des ensembles de données largement utilisés.
Nous suggérons des orientations de recherche futures pour des applications concrètes (gestion de l'occlusion, généralisation à divers utilisateurs, efficacité du traitement en temps réel, etc.).
Limitations:
Cet article peut ne pas refléter les tendances de la recherche après sa publication.
Il peut y avoir un manque d’analyse comparative approfondie d’algorithmes ou de méthodologies spécifiques.
Il est possible que nous n’ayons pas couvert de manière exhaustive tous les ensembles de données pertinents.
👍