Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Fusion multimodale dynamique sensible aux incertitudes pour la surveillance de la santé en extérieur

Created by
  • Haebom

Auteur

Zihan Fang, Zheng Lin, Senkang Hu, Yihang Tao, Yiqin Deng, Xianhao Chen, Yuguang Fang

Contour

Cet article propose DUAL-Health, un cadre de fusion multimodale prenant en compte l'incertitude pour la surveillance de la santé en environnement extérieur. Les cadres d'apprentissage profond multimodaux statiques existants nécessitent des données d'entraînement importantes et présentent des limites pour capturer les changements subtils de l'état de santé. En revanche, les modèles multimodaux de langage géant (MLLM) permettent une surveillance robuste de la santé en affinant des modèles riches en informations pré-entraînés sur de petites quantités de données. Cependant, la surveillance de la santé en extérieur basée sur les MLLM est confrontée à des défis tels que le bruit dans les données des capteurs, les difficultés de fusion multimodale robuste et les difficultés de récupération des données manquantes en raison de modes présentant des niveaux de bruit variables. DUAL-Health relève ces défis en quantifiant l'impact du bruit dans les données des capteurs, en réalisant une fusion multimodale efficace à l'aide de pondérations basées sur l'incertitude et en alignant les distributions modales au sein d'un espace sémantique commun. Les résultats expérimentaux démontrent que DUAL-Health présente une précision et une robustesse supérieures aux méthodes existantes.

Takeaways, Limitations

Takeaways:
Une nouvelle approche de la surveillance de la santé utilisant des données multimodales bruyantes provenant d'environnements extérieurs.
Obtenir une précision et une robustesse améliorées par rapport aux méthodes existantes grâce à la fusion multimodale qui prend en compte l'incertitude.
Exploiter le MLLM pour présenter le potentiel d’une surveillance efficace de la santé avec de petites quantités de données.
Limitations:
Une vérification supplémentaire des performances de généralisation du modèle proposé est nécessaire.
D’autres expériences de robustesse sont nécessaires pour différents types de données de capteurs et de conditions environnementales.
Une vérification par des tests à long terme et des essais cliniques dans des environnements réels est nécessaire.
👍