임상 항균 치료는 병원체 프로파일, 숙주 요인, 항균제의 약리학적 특성, 감염 심각도를 역동적으로 통합해야 한다. 이러한 복잡성은 지식 격차, 데이터 개인 정보 보호 문제, 높은 배포 비용, 제한된 추론 능력 등 고위험 임상 의사 결정에서 대규모 언어 모델(LLM)의 적용 가능성에 근본적인 한계를 부과한다. 이러한 과제를 해결하기 위해, KRAL(Knowledge and Reasoning Augmented Learning)을 제안한다. 이는 교사 모델의 추론을 활용하여 자동으로 지식과 추론 궤적을 추출하고, 반지도 학습을 통해 데이터 증강을 수행하며(수동 주석 요구 사항을 약 80% 감소), 에이전트 강화 학습을 사용하여 의료 지식과 추론을 공동으로 향상시키는 저비용, 확장 가능하며 개인 정보 보호를 보장하는 패러다임이다. 계층적 평가를 통해 평가 비용을 절감하고 모듈식 인터페이스 설계를 통해 시스템 업데이트를 원활하게 한다. 실험 결과는 KRAL이 RAG(Retrieval-Augmented Generation) 및 SFT(Supervised Fine-Tuning) 방법을 능가한다는 것을 보여준다. 이는 지식 질문 답변 능력과 추론 능력을 향상시켰으며, SFT의 장기 훈련 비용의 약 20%로 달성되었다.