Policy World Model (PWM)은 세계 모델링과 궤적 계획을 통합하는 새로운 자율 주행 패러다임을 제시합니다. PWM은 단일 아키텍처 내에서 세계 모델링과 궤적 계획을 통합할 뿐만 아니라, 액션이 없는 미래 상태 예측 방식을 통해 계획에 학습된 세계 지식을 활용합니다. 협력적 상태-액션 예측을 통해 PWM은 인간과 유사한 예측적 인식을 모방하여 보다 안정적인 계획 성능을 제공합니다. 비디오 예측 효율성을 높이기 위해, PWM은 컨텍스트 기반 토크나이저와 적응형 동적 초점 손실을 갖춘 동적으로 향상된 병렬 토큰 생성 메커니즘을 도입합니다. 단일 전방 카메라 입력을 사용하면서도, PWM은 다중 뷰 및 다중 모달 입력을 사용하는 최첨단 접근 방식과 동등하거나 뛰어난 성능을 보입니다.