본 논문은 전자 건강 기록(EHR) 기반 모델의 한계점인 '보지 못한 의료 코드 처리' 문제를 해결하기 위해 MedRep을 제안합니다. MedRep은 OMOP 공통 데이터 모델을 기반으로 통합된 의료 개념 표현과 환자 경로에 대한 기본 데이터 증강 전략을 제공합니다. 각 개념에 대한 정보는 대규모 언어 모델(LLM) 프롬프트를 통해 풍부하게 하고, OMOP 어휘의 그래프 온톨로지을 통해 텍스트 기반 표현을 향상시킵니다. 또한, 경로 증강을 통해 모델이 사전에 보지 못한 개념을 다룰 수 있도록 훈련합니다. 실험 결과, MedRep으로 훈련된 EHR 기반 모델은 외부 데이터셋에서 예측 성능을 더 잘 유지하는 것을 보여줍니다. 코드는 공개적으로 제공됩니다.