본 논문은 확산 모델의 추론 속도를 높이기 위한 새로운 병렬화 기법인 ParaStep을 제안합니다. 기존의 병렬화 전략들은 높은 통신 오버헤드로 인해 상용 하드웨어에서의 배포에 제한이 있었지만, ParaStep은 인접한 잡음 제거 단계 간의 유사성을 활용하여 단계별 경량 통신을 통해 이러한 문제를 해결합니다. ParaStep은 SVD, CogVideoX-2b, AudioLDM2-large 모델에서 최대 3.88배, 2.43배, 6.56배의 속도 향상을 달성하며, 생성 품질을 유지합니다. 이는 특히 대역폭 제약 환경에서 확산 모델 추론 가속화를 위한 확장 가능하고 통신 효율적인 솔루션임을 보여줍니다.