Imagine-2-Drive는 자율주행에서의 안전하고 효율적인 정책 학습을 위해 고충실도 월드 모델과 다중 모드 확산 기반 정책 에이전트를 통합한 새로운 WMRL(World Model-based Reinforcement Learning) 프레임워크입니다. 기존 WMRL의 낮은 예측 정확도 및 누적 오차 문제를 해결하기 위해, 동시에 미래 관측값을 생성하는 확산 기반 월드 모델인 DiffDreamer와 다양하고 다중 모드의 궤적 분포를 모델링하는 확산 기반 정책인 DPA(Diffusion Policy Actor)를 제시합니다. CARLA 시뮬레이션 환경에서의 실험 결과, 기존 월드 모델 기반 방법들보다 경로 완료율과 성공률을 각각 15%, 20% 향상시켰습니다.