Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Formation complète au système Agentic RAG pour un raisonnement diagnostique traçable

Created by
  • Haebom

Auteur

Qiaoyu Zheng, Yuze Sun, Chaoyi Wu, Weike Zhao, Pengcheng Qiu, Yongguo Yu, Kun Sun, Yanfeng Wang, Ya Zhang, Weidi Xie

Contour

Le diagnostic précis des modèles de langage médical à grande échelle est entravé par des lacunes dans les connaissances et des hallucinations. Si les méthodes de récupération et d'augmentation des outils sont utiles, leur impact est limité par une faible utilisation des connaissances externes et une faible traçabilité de l'inférence par rétroaction. Pour relever ces défis, cette étude présente Deep-DxSearch, un système agent-RAG entraîné de bout en bout utilisant l'apprentissage par renforcement (RL). Ce système applique une inférence traçable augmentée par récupération au diagnostic médical. Deep-DxSearch construit un vaste corpus de récupération médicale contenant les dossiers des patients et des sources de connaissances médicales fiables afin de soutenir l'inférence tenant compte de la récupération dans tous les scénarios de diagnostic. Il est crucial de faire évoluer la politique agent-RAG en utilisant l'RL sur des données à grande échelle, avec le LLM comme agent principal et le corpus de récupération comme environnement, et en adaptant les récompenses au format, à la récupération, à la structure d'inférence et à la précision du diagnostic. Les résultats expérimentaux démontrent que le cadre d'entraînement agent-RAG de bout en bout surpasse systématiquement les approches RAG par apprentissage automatique et sans formation dans plusieurs centres de données. Après la formation, Deep-DxSearch a considérablement amélioré la précision diagnostique des maladies courantes et rares, surpassant des références diagnostiques robustes telles que GPT-4o, DeepSeek-R1 et d'autres cadres spécifiques aux soins de santé, tant en distribution qu'hors distribution. De plus, des études d'ablation sur la conception des récompenses et les composants du corpus de recherche ont confirmé leur rôle important dans la mise en évidence de l'unicité et de l'efficacité de l'approche par rapport aux implémentations traditionnelles. Enfin, des études de cas et des analyses d'interprétabilité ont mis en évidence les améliorations apportées à la politique diagnostique de Deep-DxSearch, fournissant un aperçu plus approfondi de ses gains de performance et aidant les cliniciens à fournir des diagnostics préliminaires plus fiables et plus précis.

Takeaways, Limitations

Takeaways:
Nous avons considérablement amélioré la précision du diagnostic médical grâce au système d’agent RAG basé sur l’apprentissage par renforcement de bout en bout.
Il a montré des performances qui ont dépassé les modèles de pointe existants tels que GPT-4o et DeepSeek-R1.
Il a démontré d’excellentes performances dans les contextes de distribution et hors distribution et s’est avéré efficace dans le diagnostic des maladies courantes et rares.
Nous avons identifié l’importance de la conception des récompenses et du corpus de récupération, suggérant des orientations de recherche futures.
Les études de cas et les analyses d’interprétabilité vous aident à comprendre le processus de prise de décision du modèle.
Limitations:
Les informations actuellement disponibles ne fournissent pas d'informations spécifiques sur la taille des données de formation, le temps de formation et la consommation des ressources de calcul de Deep-DxSearch.
Une évaluation et une validation supplémentaires des performances dans des environnements cliniques réels sont nécessaires.
Il existe peut-être des solutions au problème d’hallucination du modèle et une marge d’amélioration supplémentaire.
Il convient de prendre en compte les questions d’accessibilité et de confidentialité liées aux données médicales à grande échelle.
👍