Este artículo ofrece un estudio exhaustivo de la investigación sobre la comprensión de la visión egocéntrica, que ha cobrado relevancia gracias al avance de la inteligencia artificial y los dispositivos portátiles. La visión egocéntrica, que captura datos visuales y multimodales mediante cámaras o sensores corporales, ofrece una perspectiva única para simular la experiencia visual humana. En este artículo, analizamos sistemáticamente los componentes de la visión egocéntrica, clasificamos las tareas en cuatro áreas principales: comprensión del sujeto, comprensión del objeto, comprensión del entorno y comprensión mixta, y exploramos en detalle las subtareas dentro de cada categoría. Además, resumimos las principales tareas y tendencias en este campo, y ofrecemos una visión general de conjuntos de datos de alta calidad sobre visión egocéntrica que servirán como recursos valiosos para futuras investigaciones. Resumimos los últimos avances y anticipamos amplias aplicaciones de la tecnología de visión egocéntrica en campos como la realidad aumentada, la realidad virtual y la inteligencia corporal, y sugerimos futuras líneas de investigación basadas en estos avances.