본 논문은 강화학습(RL) 기반 자율주행에서 안전성을 향상시키기 위한 새로운 보상 함수 설계를 제안합니다. 기존 RL 기반 자율주행 연구에서 충돌에 대한 페널티만 고려하여 충돌 직전의 위험 행위를 다루지 못하는 한계를 지적하고, 이를 해결하기 위해 다양한 주행 목표를 계층적으로 정의하고 정규화된 형태로 보상 함수에 통합하는 방법을 제시합니다. 특히, 2차원 타원 함수와 책임 민감 안전(RSS) 개념을 확장하여 다양한 주행 상황에서 위험을 고려하는 새로운 목표 함수를 도입합니다. 비신호 교차로 시나리오에서 다양한 교통 밀도에 대한 실험 결과, 제안된 보상 함수는 기존 방법 대비 충돌률을 평균 21% 감소시키면서 경로 진행 및 누적 보상 측면에서도 우수한 성능을 보임을 확인하였습니다.