Bài báo này đề xuất một khuôn khổ Tạo tăng cường truy xuất (RAG) dựa trên tác nhân cho việc trả lời câu hỏi (QA) về X quang. Để khắc phục những hạn chế của các phương pháp truy xuất một bước thông thường, chúng tôi xây dựng một hệ thống trong đó các LLM tự động phân tích các câu hỏi về X quang và truy xuất bằng chứng lâm sàng được nhắm mục tiêu theo từng bước từ radiopaedia để tạo ra các phản hồi dựa trên bằng chứng một cách linh hoạt. Chúng tôi đã đánh giá 24 LLM với nhiều kiến trúc, kích thước tham số khác nhau (từ 0,5B đến hơn 670B) và các mô hình học tập (mục đích chung, tối ưu hóa suy luận và tinh chỉnh lâm sàng) trên 104 câu hỏi được các chuyên gia đánh giá từ các tập dữ liệu RSNA-RadioQA và ExtendedQA. Truy xuất tác nhân đã cải thiện đáng kể độ chính xác chẩn đoán trung bình so với nhắc nhở không phát và RAG trực tuyến thông thường (73% so với 64%, P <0,001; 73% so với 68%, P <0,001), đặc biệt là đối với các mô hình cỡ trung bình. Hơn nữa, chúng tôi đã giảm thiểu ảo giác và tăng cường bằng chứng thực tế bằng cách thu thập bối cảnh lâm sàng có liên quan. Những cải thiện đáng kể cũng được quan sát thấy trong các mô hình được tinh chỉnh lâm sàng, cho thấy vai trò bổ sung của tìm kiếm và tinh chỉnh.