PatientSim은 다양한 환자 특성을 반영하는 현실적인 환자 시뮬레이터로, 의료 대화 시스템을 평가하고 훈련하는 데 사용될 수 있습니다. MIMIC-ED와 MIMIC-IV 데이터셋에서 추출한 실제 의료 데이터를 기반으로, 성격, 언어 능력, 병력 기억 수준, 인지 혼란 수준 등 4가지 축으로 정의된 37가지 환자 페르소나를 생성합니다. Llama 3.3을 포함한 8개의 LLM을 사실 정확도와 페르소나 일관성 측면에서 평가하였고, 의료 전문가의 검증을 거쳐 견고성을 확인했습니다. 오픈소스이며 사용자 지정이 가능한 플랫폼으로, 다양한 환자 특성에 걸쳐 의료 대화 시스템을 평가하고 의료 교육 도구로 활용될 수 있습니다.