확률적 섭동 환경에서 로봇 조작 작업에 널리 사용되는 Diffusion Policy는 다중 모드 동작 분포를 모델링하는 데 뛰어나지만, 빠른 의사 결정이 필요한 실시간 응용 프로그램에서는 계산 비용이 높은 역시간 확산(디노이징) 프로세스에 의존해야 한다는 단점이 있습니다. 본 연구에서는 동작 추론을 위해 디노이징 프로세스를 부분적으로만 수행하고, 컴퓨터에서 진행되는 역시간 확산 동역학과 병렬로 플랜트가 자체 동역학에 따라 진화하도록 하는 가능성을 연구합니다. 플랜트 동역학과 디노이징 동역학이 결합된 경우, 확산 정책을 사용하는 폐루프 시스템의 안정성에 대한 이론적 경계를 조사합니다. 본 연구는 더 빠른 모방 학습을 위한 프레임워크와 시연의 분산을 기반으로 컨트롤러의 안정성을 예측하는 지표를 제공합니다.