본 논문은 전자 건강 기록(EHR)의 복잡성과 이질성으로 인해 기존 머신러닝 기법의 적용이 어려운 점을 해결하기 위해, 대규모 언어 모델(LLM)을 활용하여 EHR을 고차원 표현으로 변환하는 방법을 제시합니다. 의료 코드를 자연어 설명으로 변환하여 마크다운 형식의 일반 텍스트 문서로 변환하고, 이를 LLM에 입력하여 EHR을 효과적으로 인코딩합니다. 이를 통해 개인 의료 데이터 접근 없이도 LLM의 의미 이해 및 일반화 능력을 활용할 수 있습니다. EHRSHOT 벤치마크의 15개 임상 과제와 UK Biobank 코호트를 이용한 실험 결과, LLM 기반 임베딩은 전문 EHR 기반 모델인 CLMBR-T-Base와 비슷하거나 더 나은 성능을 보였으며, 특히 질병 발생, 입원, 사망 예측에서 우수한 성능을 나타냈습니다. 이는 LLM 기반 EHR 인코딩이 임상 예측을 위한 확장 가능하고 일반화 가능한 대안임을 시사합니다.