Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Reconocimiento de atributos peatonales basado en eventos RGB: un conjunto de datos de referencia y un marco de fusión RWKV asimétrico

Created by
  • Haebom

Autor

Xiao Wang, Haiyang Wang, Shiao Wang, Qiang Chen, Jiandong Jin, Haoyu Song, Bo Jiang, Chenglong Li

Describir

Se han desarrollado métodos de reconocimiento de atributos peatonales basados en cámaras RGB, pero son vulnerables a las condiciones de iluminación y al desenfoque de movimiento, además de presentar limitaciones al considerar aspectos emocionales. Este artículo propone una tarea multimodal de reconocimiento de atributos peatonales mediante eventos RGB utilizando una cámara de eventos que ofrece rendimiento con poca luz, alta velocidad y bajo consumo de energía. Publicamos EventPAR, un conjunto de datos a gran escala para el reconocimiento multimodal de atributos peatonales que contiene 100 000 muestras de eventos RGB y abarca 50 atributos relacionados con la apariencia y seis emociones. Reentrenamos y evaluamos los modelos PAR existentes para establecer un punto de referencia y proponemos un marco de reconocimiento multimodal de atributos peatonales basado en RWKV. Se obtuvieron resultados de vanguardia mediante experimentos con los conjuntos de datos propuestos, MARS-Attribute y los conjuntos de datos de simulación DukeMTMC-VID-Attribute. El código fuente y el conjunto de datos estarán disponibles en GitHub.

Takeaways, Limitations

Takeaways:
Presentamos nuevas posibilidades para el reconocimiento de atributos peatonales multimodales utilizando cámaras de eventos.
Lanzamiento y evaluación comparativa de EventPAR, un conjunto de datos de reconocimiento de atributos peatonales multimodales a gran escala
Propuesta y verificación del rendimiento de un nuevo marco multimodal de reconocimiento de atributos peatonales basado en RWKV
Sentar las bases para una investigación sobre el reconocimiento de atributos de los peatones que tenga en cuenta no sólo la apariencia sino también las emociones.
Limitations:
Se necesita una mayor validación de la diversidad y el rendimiento de generalización del conjunto de datos EventPAR.
El marco propuesto basado en RWKV requiere un análisis comparativo mejorado con otros modelos.
Se necesitan evaluaciones de desempeño y análisis de robustez en entornos del mundo real.
👍