본 논문은 합성 전자 건강 기록(EHR) 생성을 위한 대규모 언어 모델(LLM)의 성능을 평가합니다. LLM이 소규모 특징 집합에서는 신뢰할 수 있는 합성 EHR을 생성하지만, 데이터 차원이 증가함에 따라 현실적인 분포와 상관관계를 유지하는 데 어려움을 겪고 다양한 병원 환경에서 일반화하는 능력이 제한된다는 것을 발견했습니다. 합성 데이터의 장점(개인 정보 보호, 데이터 스키마 제어, 공정성 향상)에도 불구하고, LLM을 이용한 합성 EHR 생성의 한계를 지적하고 있습니다.