Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Défis et tendances de la vision égocentrique : une enquête

Created by
  • Haebom

Auteur

Xiang Li, Heqian Qiu, Lanxiao Wang, Hanwen Zhang, Chenghao Qi, Linfeng Han, Huiyu Xiong, Hongliang Li

Contour

Cet article propose un aperçu complet des recherches sur la compréhension de la vision égocentrique, un domaine qui suscite un intérêt croissant grâce aux progrès de l'intelligence artificielle et des objets connectés. La vision égocentrique, qui capture des données visuelles et multimodales grâce à des caméras ou des capteurs portés sur le corps, offre une perspective unique pour simuler l'expérience visuelle humaine. Dans cet article, nous analysons systématiquement les composantes de la vision égocentrique, classons les tâches en quatre grands domaines : compréhension du sujet, compréhension de l'objet, compréhension de l'environnement et compréhension mixte, et explorons en détail les sous-tâches de chaque catégorie. De plus, nous résumons les principales tâches et tendances du domaine, et fournissons un aperçu des ensembles de données de haute qualité sur la vision égocentrique afin de fournir des ressources précieuses pour les recherches futures. Nous résumons les dernières avancées et anticipons de vastes applications de la technologie de la vision égocentrique dans des domaines tels que la réalité augmentée, la réalité virtuelle et l'intelligence incarnée, et suggérons des orientations de recherche futures basées sur ces dernières avancées.

Takeaways, Limitations_

Takeaways : Analyse exhaustive des dernières tendances et des principales problématiques de la recherche sur la compréhension visuelle égocentrique, et propose des orientations de recherche futures, fournissant ainsi des lignes directrices importantes pour la recherche dans des domaines connexes. Fournit des ressources utiles aux chercheurs grâce à une vue d'ensemble d'ensembles de données de haute qualité. Propose des applications potentielles dans divers domaines tels que la réalité augmentée, la réalité virtuelle et l'intelligence implémentée.
Limitations: Cet article offre un aperçu complet du domaine de la compréhension visuelle égocentrique, mais peut manquer d'analyse approfondie de techniques ou d'algorithmes spécifiques. De plus, en raison du développement rapide de ce domaine, de nouveaux résultats de recherche peuvent apparaître après la publication de l'article, et ces recherches récentes pourraient ne pas être prises en compte.
👍