자율 주행 차량(AV)은 인공지능(AI), 특히 강화 학습(RL)의 발전을 통해 응급 서비스의 효율성을 혁신할 잠재력을 가지고 있습니다. 그러나 기존 RL은 샘플 효율성이 낮고 동적인 응급 상황에 대한 적응성이 부족합니다. 본 논문은 이러한 한계를 해결하기 위한 차세대 AV 최적화 전략을 검토합니다. 특히, 합성 데이터 생성을 통해 정책의 견고성을 향상시키는 확산 모델(DM) 기반 RL과 재훈련 없이 신속한 적응을 가능하게 하는 대규모 언어 모델(LLM) 기반의 문맥 내 학습(ICL)을 분석합니다. 본 논문은 자율 응급 대응 시스템의 차세대를 이해하기 위한 프레임워크를 제공합니다.