TaylorSeer는 확산 변환기(DiT) 기반 이미지 및 비디오 합성의 실시간 처리를 위한 계산 비용 문제를 해결하는 새로운 방법을 제시합니다. 기존의 특징 캐싱 방식은 시간 간격이 클 때 특징 유사성이 감소하여 오류가 증가하는 문제가 있습니다. TaylorSeer는 시간 경과에 따른 특징 변화의 연속성에 착안하여, 테일러 급수 전개를 이용해 미래 시간 단계의 특징을 예측합니다. 이를 통해 고속화 비율이 높은 상황에서도 이미지 및 비디오 합성 품질 저하 없이 가속화를 달성합니다. FLUX와 HunyuanVideo에서 각각 4.99배, 5.00배의 손실 없는 가속화를 달성했으며, DiT에서는 4.53배 가속화에서 기존 최고 성능 대비 FID를 3.41 낮추었습니다.