본 연구는 캐나다 알버타주의 심장 질환 등록 코호트(2015년, 3,088명 환자, 551,095건의 진료기록)를 대상으로, 대규모 언어 모델(LLM) 기반 파이프라인을 개발하여 전자 건강 기록(EHR)의 임상 노트에서 급성 심근 경색(AMI), 당뇨병, 고혈압 등 다양한 질환을 효율적으로 식별하는 전략을 제시하였다. LLM은 특정 진단, 치료 관리 및 임상 지침을 기반으로 EHR 노트를 분석, 이해 및 해석하도록 프롬프트를 활용하였다. 성능 평가는 임상의 검증 진단을 기준으로 하였으며, 국제 질병 분류(ICD) 코드 기반 방법과 비교 분석하였다. LLM 기반 파이프라인은 AMI(민감도 88%, 특이도 63%, 양성 예측값 77%), 당뇨병(민감도 91%, 특이도 86%, 양성 예측값 71%), 고혈압(민감도 94%, 특이도 32%, 양성 예측값 72%) 진단에서 다양한 성능을 보였으며, ICD 코드 기반 방법에 비해 모든 질환에서 민감도와 음성 예측값이 향상됨을 확인하였다. LLM과 기준 표준으로 검출된 사례의 월별 추세는 일관된 패턴을 보였다.