본 논문은 로봇 조작 및 이동에 대한 모방 학습에서 확산 모델을 이용한 대규모 일반화 정책의 한계점을 지적하고, 이를 해결하기 위해 잠재 가중치 확산(Latent Weight Diffusion, LWD) 기법을 제안한다. 기존의 확산 정책(Diffusion Policy, DP)은 궤적을 생성하는데 반해, LWD는 신경망 정책의 가중치를 생성하는 방식으로 폐루프 정책을 학습한다. 이를 통해 더 긴 행동 지평, 환경의 불확실성에 대한 강건성, 그리고 낮은 추론 비용을 달성한다. 실험 결과, LWD는 DP보다 긴 행동 지평과 불확실성 환경에서 더 높은 성공률을 보였으며, 다중 작업 성능은 DP와 유사하면서도 추론 시간 연산량은 1/45 수준으로 줄였다.