Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Raisonnement médical à l'ère des LLM : une revue systématique des techniques d'amélioration et de leurs applications

Created by
  • Haebom

Auteur

Wenxuan Wang, Zizhan Ma, Meidan Ding, Shiyi Zheng, Shengyuan Liu, Jie Liu, Jiaming Ji, Wenting Chen, Xiang Li, Linlin Shen, Yixuan Yuan

Contour

Cet article est la première revue systématique à examiner les avancées et les limites des modèles de langage à grande échelle (MLH) dans le domaine de la santé. Nous soulignons que les LH manquent encore des capacités d'inférence systématiques, transparentes et vérifiables, essentielles à la pratique clinique, et analysons la transition de la génération de réponses en une seule étape au développement de LHH spécifiquement conçus pour le raisonnement médical. Nous proposons une taxonomie des techniques d'amélioration de l'inférence, classées par stratégies d'apprentissage (par exemple, apprentissage supervisé, réglage fin, apprentissage par renforcement) et mécanismes de test (par exemple, ingénierie des invites, systèmes multi-agents). Nous analysons l'application de ces techniques à diverses modalités de données (texte, images, code) et à des applications cliniques clés telles que le diagnostic, l'éducation et la planification des traitements. Nous examinons également l'évolution des critères d'évaluation, passant de simples mesures de précision à des évaluations sophistiquées de la qualité de l'inférence et de l'interprétabilité visuelle. En analysant 60 études clés publiées entre 2022 et 2025, nous identifions des défis critiques, tels que l'écart de crédibilité-plausibilité et la nécessité d'une inférence multimodale fondamentale, et suggérons des orientations futures pour construire une IA de santé efficace, robuste et sociotechniquement responsable.

Takeaways, Limitations

Takeaways : Fournit une compréhension systématique de diverses techniques et de leur application pour améliorer la capacité de raisonnement des étudiants en LLM dans le domaine médical. Il propose également des orientations futures pour l'élaboration de critères d'évaluation et propose des pistes de recherche.
Limitations: Les études analysées se limitent aux articles portant sur une période spécifique (2022-2025). Bien qu'elles soulèvent des questions importantes, telles que l'écart de crédibilité et de plausibilité et la nécessité d'une inférence multimodale de base, elles n'offrent pas de solutions spécifiques. La qualité et les biais des études analysées pourraient être négligés.
👍