본 논문은 종단 간 자율 주행의 다중 모드 행동 생성, 시간적 안정성 유지, 다양한 시나리오에 대한 일반화 문제를 해결하기 위해 지식 기반 확산 정책(KDP)을 제안합니다. KDP는 생성적 확산 모델링과 희소 전문가 혼합 라우팅 메커니즘을 통합하여, 시간적으로 일관되고 다중 모드의 행동 시퀀스를 생성하고, 상황에 따라 특수화되고 재사용 가능한 전문가를 활성화하여 모듈식 지식 구성을 가능하게 합니다. 다양한 주행 시나리오에 대한 실험 결과, KDP는 기존 방법보다 성공률이 높고, 충돌 위험이 낮으며, 제어가 더 부드러운 것을 보여줍니다. 추가 분석을 통해 희소 전문가 활성화 및 Transformer 백본의 효과, 전문가의 구조적 특수화 및 시나리오 간 재사용을 확인했습니다. 이 결과는 전문가 라우팅을 통한 확산 모델이 확장 가능하고 해석 가능한 종단 간 자율 주행을 위한 패러다임임을 보여줍니다.