Cet article propose une nouvelle méthode pour améliorer la vitesse d'inférence des transformateurs de diffusion (DiT). Le TaylorSeer conventionnel met en cache les caractéristiques intermédiaires de tous les blocs de transformateurs et prédit les caractéristiques futures par expansion de Taylor. Cependant, il présente une surcharge mémoire et de calcul importante et ne prend pas en compte la précision des prédictions. Dans cet article, nous réduisons le nombre de caractéristiques mises en cache en déplaçant la cible de prédiction de Taylor vers le dernier bloc et proposons un mécanisme de mise en cache dynamique basé sur l'erreur de prédiction du premier bloc. Cela améliore le compromis entre vitesse et qualité, permettant des gains de vitesse d'inférence de 3,17x, 2,36x et 4,14x pour FLUX, DiT et Wan Video, respectivement.