Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Exploiter les modalités audio et textuelles en santé mentale : une étude des performances des LLM

Created by
  • Haebom

Auteur

Abdelrahman A. Ali, Aya E. Fouda, Radwa J. Hanafy, Mohammed E. Fouda

Contour

Cette étude vise à améliorer la précision du diagnostic de la dépression et du trouble de stress post-traumatique (TSPT) à l'aide de modèles linguistiques à grande échelle (MLE). Nous avons évalué les performances de ces modèles, notamment Gemini 1.5 Pro et GPT-4o mini, sur l'ensemble de données E-DAIC en utilisant deux modalités : texte et audio. Plus précisément, nous avons analysé l'impact de l'intégration des modalités sur la précision diagnostique à l'aide de nouvelles mesures : le score de supériorité modale et le score de résolution des désaccords. Ainsi, le modèle Gemini 1.5 Pro a obtenu un score F1 de 0,67 et une précision équilibrée de 77,4 % pour la classification binaire de la dépression en combinant les modalités texte et audio, démontrant ainsi une amélioration des performances par rapport à l'utilisation d'une seule modalité. Ce résultat a été obtenu grâce à l'inférence zéro-shot. De plus, nous avons analysé l'évolution des performances entre différentes tâches (binaire, gravité et classification multi-classes) et les variations des invites.

Takeaways, Limitations_

Takeaways:
Présentation de la possibilité d'un diagnostic multimodal de santé mentale à l'aide du LLM.
Identifier le potentiel d’amélioration de la précision diagnostique grâce à l’intégration de modalités textuelles et audio.
Démonstration de la robustesse du modèle par inférence à coup zéro.
Excellentes performances des modèles Gemini 1.5 Pro et GPT-4o mini confirmées.
Limitations:
Limitations de la généralisabilité en utilisant un seul ensemble de données E-DAIC.
Une validation supplémentaire est nécessaire car les indicateurs utilisés (score de supériorité modale, score de résolution des désaccords) sont de nouveaux indicateurs.
Des recherches supplémentaires sont nécessaires pour déterminer son applicabilité dans des contextes cliniques réels.
Biais possible en faveur d’un modèle spécifique.
👍