ClinicalGPT-R1: Pushing reasoning capability of generalist disease diagnosis with large language model
Created by
Haebom
저자
Wuyang Lan, Wenzheng Wang, Changwei Ji, Guoxing Yang, Yongbo Zhang, Xiaohong Liu, Song Wu, Guangyu Wang
개요
본 논문은 의학 진단 분야에 대한 대규모 언어 모델(LLM)의 적용을 탐구한 연구입니다. 수만 건의 실제 임상 기록 데이터셋으로 훈련된 새로운 모델, ClinicalGPT-R1을 소개하며, 다양한 훈련 전략을 통해 진단 추론 능력을 향상시켰습니다. 7개 주요 의료 분야를 아우르는 난이도 높은 MedBench-Hard 데이터셋을 사용하여 GPT-4와 비교 평가한 결과, 중국어 진단 과제에서는 GPT-4o를 능가하고, 영어 환경에서는 GPT-4와 비슷한 성능을 보였습니다. 이는 ClinicalGPT-R1의 우수한 의학 진단 능력을 입증합니다. 소스 코드는 공개되어 있습니다.