본 연구는 비영어권 환경, 특히 자원 제약적인 환경에서의 의료 정보 추출을 위한 자연어 처리(NLP) 기술을 비교 분석합니다. 폴란드 아메리카 어린이 재활 병원의 전자 건강 기록(EHR)을 사용하여, 규칙 기반 방법과 대규모 언어 모델(LLM)의 성능을 비교 평가했습니다. 환자 인구 통계, 임상 소견, 처방 약물을 추출하며 텍스트 정규화 부족과 번역으로 인한 정보 손실의 영향을 조사했습니다. 규칙 기반 방법은 연령 및 성별 추출에서 더 높은 정확도를 보였지만, LLM은 약물명 인식에 뛰어난 성능을 보였습니다.