자율주행 차량 경로 계획에서 안전과 규정 준수가 중요해짐에 따라, 본 논문은 심층 강화 학습 모델과 운동 계획기를 통합하여 잠재적인 교통 규칙 위반을 예측하는 새로운 접근 방식을 제시한다. 비평가(critic)의 예측은 운동 계획기의 비용 함수에 직접적으로 영향을 미쳐, 궤적 선택을 안내한다. 독일 도로 교통 규정의 주요 간선도로 규칙을 규칙집에 통합하고, 그래프 기반 상태 표현을 사용하여 복잡한 교통 정보를 처리한다. 주요 혁신은 actor-critic 구조에서 표준 actor 네트워크를 운동 계획 모듈로 대체하여 예측 가능한 궤적 생성과 장기적인 규칙 위반 방지를 보장하는 것이다. 공개된 독일 고속도로 데이터셋을 이용한 실험 결과, 본 모델은 계획 지평선을 넘어 교통 규칙 위반을 예측하고 방지하여, 어려운 교통 상황에서 안전성을 크게 향상시키는 것으로 나타났다.