MedAlpaca -- An Open-Source Collection of Medical Conversational AI Models and Training Data
Created by
Haebom
Category
Empty
저자
Tianyu Han, Lisa C. Adams, Jens-Michalis Papaioannou, Paul Grundmann, Tom Oberhauser, Alexei Figueroa, Alexander Loser, Daniel Truhn, Keno K. Bressem
개요
본 논문은 의료 분야에 적용 가능한 대규모 언어 모델(LLM)을 개선하기 위해 16만 개 이상의 항목으로 구성된 새로운 데이터셋을 제시합니다. 공개적으로 접근 가능한 사전 훈련된 LLM을 이 데이터셋으로 미세 조정하고, 미세 조정된 모델과 사전 훈련된 모델만을 사용한 모델의 성능을 의사 자격 시험과 관련된 평가를 통해 비교 분석합니다. 특히 환자 개인 정보 보호를 위해 온프레미스 배포가 가능한 오픈소스 모델의 필요성에 중점을 두고 있습니다.