자율 주행 분야에서 유망한 접근법으로 부상한 World model은 인간과 유사한 인지 및 의사 결정 과정을 모방하여 동적 환경에 예측하고 적응합니다. 기존 방법은 고차원 관측치를 압축된 잠재 공간에 매핑하고, 이 잠재 표현 내에서 최적 정책을 학습합니다. 본 논문에서는 자가 차량 동역학과 환경 전이 동역학을 분리하여 자가 차량 동역학 모델링을 분리하는 Vehicle Dynamics embedded Dreamer (VDD) 방법을 제안합니다. 이는 다양한 차량 매개변수에 대해 효과적으로 일반화할 수 있도록 합니다. 또한, 배포 시 정책 조정(PAD) 및 훈련 중 정책 증강(PAT)을 통해 학습된 정책의 견고성을 향상시키는 두 가지 전략을 도입합니다. 시뮬레이션 환경에서 진행된 실험을 통해 제안된 모델이 기존 방법보다 주행 성능과 차량 동역학 변동에 대한 견고성을 크게 향상시켰음을 확인했습니다.