Cet article propose un cadre de génération augmentée de récupération (RAG) basé sur des agents pour la réponse aux questions de radiologie (AQ). Pour surmonter les limites des méthodes conventionnelles de récupération en une seule étape, nous avons construit un système dans lequel les LLM décomposent de manière autonome les questions de radiologie et récupèrent de manière itérative des preuves cliniques ciblées à partir de la radiopédie afin de générer dynamiquement des réponses fondées sur des preuves. Nous avons évalué 24 LLM avec des architectures, des tailles de paramètres (de 0,5 B à plus de 670 B) et des paradigmes d'apprentissage variés (usage général, optimisation de l'inférence et ajustement clinique) sur 104 questions évaluées par des experts issues des ensembles de données RSNA-RadioQA et ExtendedQA. La récupération d'agent a significativement amélioré la précision diagnostique moyenne par rapport à l'invite zéro-shot et au RAG en ligne conventionnel (73 % contre 64 %, p < 0,001 ; 73 % contre 68 %, p < 0,001), en particulier pour les modèles de taille moyenne. De plus, nous avons réduit les hallucinations et amélioré les preuves factuelles en récupérant un contexte cliniquement pertinent. Des améliorations significatives ont également été observées dans les modèles cliniquement affinés, suggérant des rôles complémentaires de la recherche et de l'affinement.