본 논문은 대량 사상자 발생 사고(MCI)에서 응급 의료 대응의 효율성을 높이기 위한 다중 에이전트 희생자 태깅 문제를 다룬다. 희생자 태깅 시간을 최소화하는 것을 목표로, 다섯 가지 분산형 휴리스틱 알고리즘을 제시하고 시뮬레이션 실험을 통해 평가한다. 또한, 희생자 태깅 시간을 최소화하기 위한 다중 에이전트 강화 학습(MARL) 전략인 FDQN(factorized deep Q-network)을 제시하고 휴리스틱 알고리즘과 성능을 비교 분석한다. 실험 결과, 지역적 통신을 기반으로 가장 가까운 희생자를 선택하고 재계획하는 휴리스틱 알고리즘이 효율적이며, FDQN은 소규모 시나리오에서 휴리스틱 알고리즘보다 우수한 성능을 보이는 반면, 복잡한 시나리오에서는 휴리스틱 알고리즘이 더 나은 성능을 보이는 것을 확인하였다. 이를 통해 실제 응용을 위한 MARL의 한계와 주요 통찰력을 제시한다.