Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

LiteFat : Apprentissage graphique spatio-temporel léger pour la détection de la fatigue du conducteur en temps réel

Created by
  • Haebom

Auteur

Jing Ren, Suyu Ma, Hong Jia, Xiwei Xu, Ivan Lee, Haytham Fayek, Xiaodong Li, Feng Xia

Contour

Cet article propose LiteFat, un modèle léger d'apprentissage de graphes spatio-temporels pour les systèmes de détection de la fatigue du conducteur. Les modèles existants de détection de la fatigue basés sur l'apprentissage profond peinent à être appliqués aux dispositifs robotiques embarqués aux ressources limitées (par exemple, les véhicules autonomes) en raison de leur complexité de calcul et de leur latence élevées. LiteFat résout ce problème en transformant les données vidéo en streaming en un graphe spatio-temporel (GST) grâce à la détection de points de repère faciaux, se concentrant ainsi sur les schémas de mouvement clés et réduisant le traitement inutile des données. MobileNet extrait les caractéristiques faciales et génère une matrice de caractéristiques pour le GST, tandis qu'un réseau neuronal léger basé sur un graphe spatio-temporel identifie les signes de fatigue avec un traitement minimal et une faible latence. Les résultats expérimentaux sur des jeux de données de référence démontrent que LiteFat surpasse les méthodes de pointe existantes tout en réduisant considérablement la complexité de calcul et la latence.

Takeaways, Limitations

Takeaways:
Permettre la détection de la fatigue du conducteur en temps réel dans les systèmes embarqués à ressources limitées.
Convient aux applications en temps réel en raison d'une complexité de calcul et d'une latence inférieures par rapport aux modèles d'apprentissage en profondeur existants.
Maintient une grande précision malgré le fait qu'il s'agisse d'un modèle léger.
Limitations:
Les performances du modèle proposé peuvent dépendre de l'ensemble de données de référence utilisé. Une validation supplémentaire est nécessaire dans diverses conditions et avec différents ensembles de données.
Des recherches supplémentaires sont nécessaires sur la robustesse à diverses variables dans des environnements de conduite réels (éclairage, angle, différences individuelles, etc.).
Les performances de l'extraction des caractéristiques faciales avec MobileNet peuvent avoir un impact sur les performances globales du système. Des recherches sont nécessaires pour développer des méthodes d'extraction plus efficaces.
👍