Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Desafíos y tendencias de la visión egocéntrica: una encuesta

Created by
  • Haebom

Autor

Xiang Li, Heqian Qiu, Lanxiao Wang, Hanwen Zhang, Chenghao Qi, Linfeng Han, Huiyu Xiong, Hongliang Li

Describir

Este artículo ofrece un estudio exhaustivo de la investigación sobre la comprensión de la visión egocéntrica, que ha cobrado relevancia gracias al avance de la inteligencia artificial y los dispositivos portátiles. La visión egocéntrica, que captura datos visuales y multimodales mediante cámaras o sensores corporales, ofrece una perspectiva única para simular la experiencia visual humana. En este artículo, analizamos sistemáticamente los componentes de la visión egocéntrica, clasificamos las tareas en cuatro áreas principales: comprensión del sujeto, comprensión del objeto, comprensión del entorno y comprensión mixta, y exploramos en detalle las subtareas dentro de cada categoría. Además, resumimos las principales tareas y tendencias en este campo, y ofrecemos una visión general de conjuntos de datos de alta calidad sobre visión egocéntrica que servirán como recursos valiosos para futuras investigaciones. Resumimos los últimos avances y anticipamos amplias aplicaciones de la tecnología de visión egocéntrica en campos como la realidad aumentada, la realidad virtual y la inteligencia corporal, y sugerimos futuras líneas de investigación basadas en estos avances.

Takeaways, Limitations

Takeaways: Analiza exhaustivamente las últimas tendencias y tareas clave en la investigación sobre la comprensión visual egocéntrica y sugiere futuras líneas de investigación, proporcionando así importantes directrices para la investigación en campos relacionados. Ofrece recursos útiles para investigadores mediante una visión general de conjuntos de datos de alta calidad. Sugiere posibles aplicaciones en diversos campos, como la realidad aumentada, la realidad virtual y la inteligencia artificial.
Limitations: Este artículo ofrece un estudio exhaustivo del campo de la comprensión visual egocéntrica, pero podría carecer de un análisis profundo de técnicas o algoritmos específicos. Además, debido a la naturaleza de este campo en rápido desarrollo, podrían surgir nuevos resultados de investigación tras la publicación del artículo, y dichas investigaciones recientes podrían no verse reflejadas.
👍