Este artículo propone un marco de Recuperación-Generación Aumentada (RAG) basado en agentes para la respuesta a preguntas (QA) en radiología. Para superar las limitaciones de los métodos convencionales de recuperación de un solo paso, construimos un sistema en el que los LLM descomponen de forma autónoma las preguntas de radiología y recuperan iterativamente evidencia clínica específica de la radiopedia para generar dinámicamente respuestas basadas en la evidencia. Evaluamos 24 LLM con diversas arquitecturas, tamaños de parámetros (de 0,5 B a más de 670 B) y paradigmas de aprendizaje (propósito general, optimización de inferencias y ajuste clínico) en 104 preguntas revisadas por expertos de los conjuntos de datos RSNA-RadioQA y ExtendedQA. La recuperación de agentes mejoró significativamente la precisión diagnóstica promedio en comparación con la incitación de disparo cero y la RAG en línea convencional (73 % frente a 64 %, p < 0,001; 73 % frente a 68 %, p < 0,001), especialmente para modelos de tamaño mediano. Además, redujimos las alucinaciones y mejoramos la evidencia factual al recuperar el contexto clínicamente relevante. También se observaron mejoras significativas en los modelos clínicamente ajustados, lo que sugiere funciones complementarias de la búsqueda y el ajuste.