본 논문은 대규모 언어 모델(LLM)의 스케일링 법칙을 전자 건강 기록(EHR) 데이터에 적용하여 실증적으로 연구한 최초의 연구입니다. MIMIC-IV 데이터베이스의 환자 타임라인 데이터를 사용하여 다양한 모델 크기와 컴퓨팅 예산으로 트랜스포머 아키텍처를 학습시킨 결과, 이차곡선 형태의 IsoFLOPs 곡선과 컴퓨팅, 모델 파라미터, 데이터 크기 및 임상 유용성 간의 거듭제곱 법칙 관계를 포함한 일관된 스케일링 패턴을 확인했습니다. 이는 EHR 모델이 LLM과 유사한 스케일링 동작을 보임을 보여주며, 자원 효율적인 학습 전략에 대한 예측적 통찰력을 제공합니다. 결과적으로 임상 예측 작업을 변화시키고 개인 맞춤형 의료를 발전시킬 수 있는 강력한 EHR 기반 모델 개발의 기초를 마련했습니다.