Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

USAD : un réseau de diffusion d'attention spatio-temporelle à augmentation de données non supervisée

Created by
  • Haebom

Auteur

Ying Yu, Hang Xiao, Siyao Li, Jiarui Li, Haotian Tang, Hanyu Liu, Chao Li

Contour

Dans cet article, nous proposons une méthode d'optimisation complète centrée sur le mécanisme d'interaction multi-attention afin de résoudre les problèmes de reconnaissance d'activité humaine (HAR), tels que le manque d'échantillons étiquetés, la difficulté d'extraction de caractéristiques de grande dimension et les faibles performances sur les dispositifs légers. Dans un premier temps, nous effectuons une augmentation des données à l'aide d'un modèle de diffusion basé sur l'apprentissage non supervisé et concevons un réseau d'interaction spatio-temporel multi-branches pour extraire des caractéristiques multi-échelles. Ce réseau intègre les mécanismes d'attention temporelle et spatiale et améliore la capacité de représentation des caractéristiques grâce à une unité de fusion de caractéristiques entre les branches. Enfin, nous ajustons dynamiquement les poids de perte et optimisons le modèle grâce à une stratégie adaptative de fusion de fonctions multi-pertes. La méthode proposée surpasse les méthodes existantes sur trois jeux de données publics : WISDM, PAMAP2 et OPPORTUNITY. Son efficacité et sa faisabilité sont vérifiées par un déploiement pratique sur des dispositifs embarqués.

Takeaways, Limitations

Takeaways:
Contribue à résoudre le problème du manque d'étiquettes et à améliorer les performances grâce à des techniques d'augmentation de données non supervisées.
Extraction efficace de caractéristiques spatio-temporelles à l'aide de multiples mécanismes d'attention.
Démontrer la praticité en vérifiant la faisabilité de la mise en œuvre pratique sur des appareils légers.
Obtenez d’excellentes performances sur une variété d’ensembles de données.
Limitations:
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de la méthode proposée.
Il peut y avoir une optimisation excessive des performances pour certains ensembles de données.
Manque d’évaluation des performances pour d’autres types de données de capteurs ou d’activités plus complexes.
Une analyse plus approfondie est nécessaire sur le coût de calcul du modèle de diffusion et l’efficacité du processus d’augmentation des données.
👍