Este artículo propone TaylorSeer para abordar el alto costo computacional del Transformador de Difusión (DiT), que destaca en la síntesis de imágenes y video de alta resolución. Los métodos actuales de almacenamiento en caché de características presentan un mayor error debido a la disminución de la similitud de características en intervalos de tiempo amplios. TaylorSeer supera esta limitación prediciendo características en pasos de tiempo futuros basándose en los valores de características de pasos de tiempo anteriores. Aprovecha el cambio lento y continuo de características a lo largo de los pasos de tiempo para aproximar derivadas de orden superior mediante la expansión de series de Taylor y predecir características futuras. Los resultados experimentales demuestran que TaylorSeer alcanza altas tasas de aceleración en la síntesis de imágenes y video, alcanzando aceleraciones de 4.99x y 5.00x con prácticamente ninguna pérdida de rendimiento en FLUX y HunyuanVideo, respectivamente. En DiT, alcanza una aceleración de 4.53x mientras reduce la FID en 3.41x en comparación con el rendimiento de vanguardia anterior.