Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

RGB-Event based Pedestrian Attribute Recognition: A Benchmark Dataset and An Asymmetric RWKV Fusion Framework

Created by
  • Haebom

作者

Xiao Wang, Haiyang Wang, Shiao Wang, Qiang Chen, Jiandong Jin, Haoyu Song, Bo Jiang, Chenglong Li

概要

従来の歩行者属性認識方法は、RGBカメラに基づいて開発されているが、照明条件や動きの曇りに対して脆弱で感情的な側面を考慮に入れない限界がある。本論文は、低照度、高速、低電力消費の利点を有するイベントカメラを利用して、マルチモードRGBイベント歩行者属性認識課題を提示する。 100K個のRGBイベントサンプルを含む大規模マルチモード歩行者属性認識データセットEventPARを公開し、外観と6つの感情に関連する50個の属性を扱います。既存のPARモデルを再訓練し評価してベンチマークを構築し、RWKVベースのマルチモード歩行者属性認識フレームワークを提案する。提案されたデータセットとMARS-Attribute、DukeMTMC-VID-Attributeシミュレーションデータセットでの実験により、最先端の結果を達成した。ソースコードとデータセットはフラッグハブに公開される予定です。

Takeaways、Limitations

Takeaways:
イベントカメラを利用したマルチモード歩行者属性認識の新たな可能性を提示
大規模マルチモード歩行者属性認識データセットEventPAR公開とベンチマークの構築
RWKVベースの新しいマルチモード歩行者属性認識フレームワークの提案と性能検証
見た目だけでなく、感情まで考慮した歩行者属性認識研究の基盤づくり
Limitations:
EventPAR データセットの多様性と一般化パフォーマンスの追加検証が必要
提案されたRWKVベースのフレームワークの他のモデルとの比較分析の強化が必要
実環境での性能評価とロバストネス分析が必要
👍