Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Reconnaissance des attributs piétons basée sur les événements RVB : un ensemble de données de référence et un cadre de fusion RWKV asymétrique

Created by
  • Haebom

Auteur

Xiao Wang, Haiyang Wang, Shiao Wang, Qiang Chen, Jiandong Jin, Haoyu Song, Bo Jiang, Chenglong Li

Contour

Les méthodes existantes de reconnaissance d'attributs piétons ont été développées à partir de caméras RVB. Cependant, elles sont vulnérables aux conditions d'éclairage et au flou de mouvement, et présentent des limites pour la prise en compte des aspects émotionnels. Cet article propose une tâche de reconnaissance d'attributs piétons multimodaux d'événements RVB utilisant une caméra événementielle, performante en basse lumière, rapide et à faible consommation d'énergie. Nous publions EventPAR, un jeu de données de reconnaissance d'attributs piétons multimodaux à grande échelle contenant 100 000 échantillons d'événements RVB et couvrant 50 attributs liés à l'apparence et six émotions. Nous reformons et évaluons les modèles PAR existants afin d'établir une référence et proposons un cadre de reconnaissance d'attributs piétons multimodaux basé sur RWKV. Des résultats de pointe sont obtenus grâce à des expérimentations sur le jeu de données proposé, MARS-Attribute et les jeux de données de simulation DukeMTMC-VID-Attribute. Le code source et le jeu de données seront disponibles sur GitHub.

Takeaways, Limitations

Takeaways:
Présentation de nouvelles possibilités de reconnaissance multimodale des attributs des piétons à l'aide de caméras événementielles.
Lancement et analyse comparative d'EventPAR, un ensemble de données de reconnaissance d'attributs piétonniers multimodaux à grande échelle
Proposition et vérification des performances d'un nouveau cadre de reconnaissance des attributs piétons multimodaux basé sur RWKV
Jeter les bases d’une recherche sur la reconnaissance des attributs des piétons qui prend en compte non seulement l’apparence mais aussi les émotions.
Limitations:
Une validation supplémentaire de la diversité et des performances de généralisation de l’ensemble de données EventPAR est nécessaire.
Le cadre proposé basé sur RWKV nécessite une analyse comparative améliorée avec d’autres modèles.
Une évaluation des performances et une analyse de la robustesse dans des environnements réels sont nécessaires.
👍