본 논문은 의생명 정보학 분야에서 오픈소스 주석 과학 자료의 부족이라는 문제를 해결하기 위해, 의생명 대규모 언어 모델(LLM) 훈련을 위한 지식 기반 에이전트 프레임워크를 제시한다. 의학 주제표제(MeSH) 계층구조를 기반으로 특화된 여러 에이전트가 협력하여 방대한 과학 문헌에서 고품질 텍스트 데이터를 자율적으로 추출, 합성 및 자체 평가하는 다중 에이전트 아키텍처를 중심으로 한다. 이를 통해 의생명 온톨로지와의 일관성을 유지하면서 수동 작업을 최소화하고, 도메인 특화 질의응답 쌍을 생성 및 개선한다. 실험 결과, 제안된 다중 에이전트 증류 데이터셋으로 훈련된 언어 모델은 의생명 질의응답 과제에서 기존 최고 성능의 생명과학 LLM 기준 모델 및 고급 독점 모델을 능가하는 성능을 보였다. 특히, Llama3-70B는 AI-Ready 데이터셋을 통해 GPT-4 with MedPrompt 및 Med-PaLM-2를 능가하는 성능을 달성하였다. 추가적으로, ablation study와 사례 분석을 통해 각 에이전트의 효과와 시너지를 검증하였다.