Cet article examine l'efficacité des modèles linguistiques à grande échelle (MLH) open source pour extraire les événements clés (motifs d'admission, événements hospitaliers majeurs et mesures de suivi importantes) des résumés médicaux, notamment des comptes rendus de sortie. Nous évaluons également l'incidence des hallucinations, qui peuvent affecter la précision et la fiabilité des LH. Des expériences utilisant des LH tels que Qwen2.5 et DeepSeek-v2 démontrent d'excellentes performances dans l'extraction des motifs d'admission et des événements survenus pendant l'hospitalisation, mais présentent des incohérences dans l'identification des recommandations de suivi. Cela met en évidence les difficultés d'exploiter les LH pour une synthèse exhaustive.