본 논문은 확산 변환기(diffusion transformers)를 위한 훈련이 필요 없는 비디오 모션 전송 방법인 RoPECraft를 제안한다. 이 방법은 회전 위치 임베딩(RoPE)을 수정하여 작동한다. 먼저 참조 비디오에서 밀집된 광학 흐름(optical flow)을 추출하고, 이를 통해 RoPE의 복소 지수 텐서를 워핑하여 생성 프로세스에 모션을 효과적으로 인코딩한다. 그런 다음, 예측된 속도와 대상 속도 간의 궤적 정렬을 통해 denoising 단계에서 흐름 일치 목표를 사용하여 이러한 임베딩을 최적화한다. 텍스트 프롬프트에 충실하고 중복 생성을 방지하기 위해, 참조 비디오의 푸리에 변환의 위상 성분을 기반으로 하는 정규화 항을 통합하여 위상 각도를 부드러운 매니폴드에 투영하여 고주파 아티팩트를 억제한다. 실험 결과 RoPECraft는 최근에 발표된 모든 방법을 정성적, 정량적으로 능가하는 성능을 보였다.