Cet article propose un aperçu complet des recherches sur la compréhension de la vision égocentrique, un domaine qui suscite un intérêt croissant grâce aux progrès de l'intelligence artificielle et des objets connectés. La vision égocentrique, qui capture des données visuelles et multimodales grâce à des caméras ou des capteurs portés sur le corps, offre une perspective unique pour simuler l'expérience visuelle humaine. Dans cet article, nous analysons systématiquement les composantes de la vision égocentrique, classons les tâches en quatre grands domaines : compréhension du sujet, compréhension de l'objet, compréhension de l'environnement et compréhension mixte, et explorons en détail les sous-tâches de chaque catégorie. De plus, nous résumons les principales tâches et tendances du domaine, et fournissons un aperçu des ensembles de données de haute qualité sur la vision égocentrique afin de fournir des ressources précieuses pour les recherches futures. Nous résumons les dernières avancées et anticipons de vastes applications de la technologie de la vision égocentrique dans des domaines tels que la réalité augmentée, la réalité virtuelle et l'intelligence incarnée, et suggérons des orientations de recherche futures basées sur ces dernières avancées.