본 논문은 임상 예측을 위한 전자 건강 기록(EHR) 표현 방법 비교를 위한 최초의 체계적인 벤치마크를 제시한다. 다변량 시계열, 이벤트 스트림, LLM을 위한 텍스트 이벤트 스트림을 포함한 다양한 EHR 표현 방법을 비교하며, MIMIC-IV 데이터셋(ICU) 및 EHRSHOT 데이터셋(장기 치료)을 사용하여 두 가지 임상 환경에서 표준화된 데이터 큐레이션 및 평가를 수행한다. Transformer, MLP, LSTM, Retain, CLMBR 등 다양한 모델을 평가하고, 결측 데이터를 기반으로 한 특징 제거의 영향을 분석했다. 이벤트 스트림 모델이 일관되게 가장 강력한 성능을 보였으며, CLMBR과 같은 사전 훈련된 모델은 소량의 데이터 환경에서 효율적이었다. 임상 환경에 따라 특징 선택 전략을 조정해야 함을 밝혀냈다.