자율주행차의 윤리적 의사결정 문제를 해결하기 위해, 충돌 확률과 피해 심각성을 결합한 윤리적 위험 비용을 사용하는 계층적 Safe Reinforcement Learning (Safe RL) 프레임워크를 제안합니다. 이 프레임워크는 고위험 상황 학습을 강화하는 Prioritized Experience Replay와 부드러운 궤적 생성을 위한 경로 계획 및 제어기를 활용합니다. 대규모 실제 교통 데이터셋을 기반으로 한 시뮬레이션 환경에서 성능을 검증했으며, 기존 방식보다 위험 감소, 자율주행차 성능 유지, 편안함 개선 효과를 보였습니다.