본 논문은 비디오 생성 속도 향상을 위해 파이프라인 방식을 활용한 PipeDiT 프레임워크를 제안합니다. Diffusion Transformer (DiT) 기반 모델의 느린 추론 속도와 높은 메모리 소비 문제를 해결하기 위해, Sequence Parallelism (SP)을 위한 파이프라인 알고리즘(PipeSP), Diffusion 모듈과 VAE 모듈 분리 (DeDiVAE), 그리고 Attention co-processing (Aco) 방법을 도입했습니다. OpenSoraPlan 및 HunyuanVideo에 PipeDiT를 통합하여 8-GPU 시스템에서 실험한 결과, 기존 프레임워크 대비 1.06x에서 4.02x의 속도 향상을 달성했습니다.