본 논문은 대규모 언어 모델(LLM)을 활용한 전자 건강 기록(EHR) 내 의료 개체명 인식(NER)에 대한 연구를 다룬다. 특히 GPT-4o와 DeepSeek-R1을 사용하여 제로샷, 퓨샷, 앙상블 등 다양한 프롬프트 엔지니어링 기법을 적용하여 실험을 진행했다. 그 결과, GPT-4o에 앙상블 기법을 적용한 경우 F1 점수 0.95, 재현율 0.98을 달성하여 DeepSeek-R1을 능가하는 성능을 보였다. 앙상블 기법은 임베딩 기반 유사도 및 다수결 투표를 통해 신뢰도를 향상시켰다.