Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Reconstruire les trajectoires du sepsis à partir de rapports de cas cliniques à l'aide de LLM : le corpus de séries chronologiques textuelles sur le sepsis

작성자
  • Haebom

Auteur

Shahriar Noroozizadeh, Jeremy C. Weiss

Contour

Cet article présente un pipeline permettant d'extraire et d'annoter les résultats cliniques des dossiers patients (rapports de cas) au fil du temps, à l'aide de modèles linguistiques à grande échelle (MLH) pour l'analyse de séries chronologiques de données de santé. Nous construisons un corpus textuel de séries chronologiques de 2 139 dossiers de patients atteints de sepsis (Sepsis-3) à partir du sous-ensemble PubMed Open Access (PMOA) et validons le système par comparaison avec l'ensemble de données I2B2/MIMIC-IV. En utilisant les modèles O1-preview et Llama 3.3 70B Instruct, nous démontrons un taux de correspondance des événements élevé (~0,75) et une forte concordance (~0,93). Cependant, nous soulignons les limites des MHL dans la reconstruction temporelle, suggérant des améliorations potentielles grâce à l'intégration multimodale.

Takeaways, Limitations_

Takeaways:
Nous démontrons que des modèles linguistiques à grande échelle peuvent être utilisés pour extraire et annoter efficacement les résultats cliniques au fil du temps à partir de dossiers médicaux.
La génération automatisée de séries chronologiques de données médicales offre la possibilité de développer des analyses médicales et des modèles prédictifs plus sophistiqués.
Contribuer à l'activation de la recherche médicale en fournissant un corpus de séries temporelles de textes selon le temps d'accès libre.
Limitations:
Les capacités de reconstruction temporelle du LLM présentent des limites.
La nécessité d’améliorer les performances grâce à l’intégration de données multimodales est soulevée.
Un examen plus approfondi de la généralisabilité de l’ensemble de données utilisé pour évaluer les performances du modèle est nécessaire.
👍