인구 기반 암 등록(PBCR)에서 비정형 병리 보고서에서 데이터를 수동으로 추출하는 과정은 10만 건의 보고서에 대해 900시간의 인력을 소모하는 등 병목 현상을 초래합니다. 본 논문에서는 소규모 언어 모델(SLM)과 대규모 언어 모델(LLM)을 활용하는 새로운 앙상블 기반 접근 방식인 ELM(Ensemble of Language Models)을 제시합니다. ELM은 병리 보고서의 상단과 하단을 각각 처리하는 6개의 미세 조정된 SLM을 사용하여 보고서 적용 범위를 극대화합니다. 종양 그룹 분류에는 6개 중 5개의 일치가 필요하며, 불일치는 신중하게 구성된 프롬프트를 사용하는 LLM이 조정합니다. 19개 종양 그룹에 대한 평가 결과, ELM은 평균 정밀도 및 재현율 0.94를 달성하여 단일 모델 및 LLM이 없는 앙상블 접근 방식을 능가했습니다. 브리티시 콜롬비아 암 등록부에 배포된 ELM은 PBCR 환경에서 LLM을 성공적으로 적용하여 최첨단 결과를 달성하고 연간 수백 시간의 인력을 절약하는 방법을 보여줍니다.