본 논문은 대규모 언어 모델(LLM)이 의료 질문 응답 분야에서 전문 지식을 간과하는 문제를 해결하기 위해, 응급 의료 서비스(EMS) 분야에 특화된 데이터셋과 방법을 제안한다. 10개의 임상 주제 영역과 4개의 자격증 레벨을 포괄하는 24,300개의 객관식 질문으로 구성된 EMSQA 데이터셋을 구축하고, 주제 영역별 지식 기반을 제공한다. 또한, 특정 임상 주제 영역과 자격증 레벨을 기반으로 하는 Expert-CoT 프롬프팅 전략과 주제 영역별 문서를 활용하는 ExpertRAG 검색 증강 생성 파이프라인을 도입한다. 실험 결과, Expert-CoT와 ExpertRAG를 결합한 모델은 기존 방법 대비 향상된 성능을 보였으며, 특히 320억 개의 매개변수를 가진 모델은 EMS 인증 시뮬레이션 시험을 통과했다.