Bài báo này đề xuất mô hình Reinforced Inference Augmentation Generation (ReinRAG), nhằm mục đích tạo ra các hướng dẫn xuất viện dạng dài từ thông tin bệnh nhân hạn chế. ReinRAG cung cấp hướng dẫn ngữ nghĩa rõ ràng cho LLM bằng cách tìm kiếm các đường dẫn suy luận trong biểu đồ kiến thức y tế. Để giải quyết các khoảng trống thông tin, chúng tôi đề xuất tối ưu hóa truy xuất dựa trên nhóm (GRO) để cải thiện chất lượng truy xuất với các phần thưởng được chuẩn hóa theo nhóm và khuyến khích các bước nhảy suy luận cho suy luận sâu trong LLM. Kết quả thử nghiệm trên các tập dữ liệu thực tế chứng minh rằng ReinRAG vượt trội hơn các phương pháp hiện có về cả hiệu quả lâm sàng và số liệu tạo ngôn ngữ tự nhiên. Phân tích sâu hơn chứng minh rằng ReinRAG thu hẹp các khoảng cách ngữ nghĩa trong đầu vào không đủ và đảm bảo rằng các đường dẫn suy luận được thu thập tập trung vào bằng chứng chính và tuân theo các suy luận nhất quán, do đó ngăn ngừa việc diễn giải sai lâm sàng trong LLM.