본 논문은 응급실 분류(트리아주)에 대한 대규모 언어 모델(LLM)의 적용 가능성을 체계적으로 조사한 연구입니다. LLM의 분포 변화 및 결측 데이터에 대한 강건성, 그리고 성별과 인종 간 교차 분석을 통한 반사실적 편향 분석에 초점을 맞추었습니다. 연속적 사전 훈련부터 문맥 내 학습까지 다양한 LLM 기반 접근 방식과 기계 학습 접근 방식을 평가하여, LLM이 우수한 강건성을 보임을 확인하고 그 원인을 분석하였습니다. 또한, 성별과 인종의 특정 교차점에서 LLM의 선호도 격차를 확인하였으며, LLM이 특정 임상 환경이나 특징 조합에서 나타나는 인구 통계적 선호도를 내포하고 있음을 시사합니다.