Bài báo này đề xuất một biểu diễn khái niệm y khoa mới (MedRep) dựa trên Mô hình Dữ liệu Chung (CDM) của OMOP. Mặc dù hiệu suất của các mô hình dựa trên hồ sơ sức khỏe điện tử (EHR) được cải thiện, MedRep vẫn giải quyết được những thách thức trong việc khái quát hóa và tích hợp các mô hình được đào tạo trên các từ vựng khác nhau do việc xử lý các mã y tế chưa đăng ký. MedRep làm phong phú thêm thông tin của từng khái niệm bằng cách thêm các định nghĩa tối thiểu sử dụng các gợi ý của Mô hình Ngôn ngữ Quy mô Lớn (LLM) và bổ sung các biểu diễn văn bản dựa trên ontology đồ thị trong từ vựng OMOP. Kết quả thực nghiệm chứng minh rằng MedRep vượt trội hơn các mô hình dựa trên EHR hiện có và các mô hình sử dụng các bộ phân tích mã y tế hiện có trên nhiều tác vụ dự đoán khác nhau, và khả năng khái quát hóa của nó được chứng minh thông qua xác thực bên ngoài.