본 논문은 비디오 생성 분야에서 최첨단 기법으로 자리 잡은 Diffusion Transformer (DiT)의 처리 속도를 높이는 방법을 제시합니다. DiT는 순차적인 잡음 제거 과정으로 인해 처리 속도가 느린 한계를 가지는데, 기존의 가속화 방법들은 성능 저하 또는 중간 특징 재사용의 어려움을 겪었습니다. 본 논문에서는 DiT 블록의 특징 변화 패턴을 분석하여 중간 단계에서 특징 유사성이 높다는 점을 발견하고, 이를 바탕으로 학습이 필요 없는 새로운 가속화 기법인 Block-Wise Caching (BWCache)를 제안합니다. BWCache는 DiT 블록의 특징을 동적으로 캐싱하고 재사용하며, 유사성 지표를 통해 불필요한 계산을 최소화하면서 시각적 품질을 유지합니다. 실험 결과, 여러 비디오 확산 모델에서 최대 2.24배의 속도 향상을 달성했습니다.