블록 인과 비디오 생성이 속도-품질 트레이드 오프에 직면하는 문제를 해결하기 위해, 훈련 없이 병렬화를 통해 속도 향상을 이루는 Block Cascading 기법을 제안한다. 미래 비디오 블록 생성을 위해 이전 블록의 부분적으로 디노이즈된 컨텍스트를 활용하여, 순차적 파이프라인을 병렬 캐스케이드로 변환한다. 이를 통해 여러 블록이 동시에 디노이징될 수 있다. 5개의 GPU를 사용하여, 1.3B 모델은 16 FPS에서 30 FPS로, 14B 모델은 4.5 FPS에서 12.5 FPS로 가속화했다. 또한, 대화형 생성 시 컨텍스트 전환에 따른 KV-recaing 오버헤드 (~200ms)를 제거했다. 블록 인과 파이프라인에서 Block Cascading 파이프라인으로 전환해도 생성 품질 저하가 없음을 검증했다.