En este artículo, presentamos DFVEdit, un método eficiente de edición de video de disparo cero para Transformadores de Difusión de Video (Video DiTs). Mientras que los métodos de edición de video existentes requieren corrección o ajuste fino de la atención, lo cual requiere amplios recursos computacionales al aplicarse a Video DiTs, DFVEdit resuelve estos problemas manipulando directamente variables latentes limpias mediante la transformación de flujo. Integramos la edición y el muestreo desde una perspectiva de flujo continuo, proponemos vectores de flujo delta condicionales (CDFV), que son estimadores de DFV teóricamente insesgados, e integramos la guía de atención cruzada implícita (ICA) y la mejora de la incrustación (ER) para mejorar la calidad de la edición. Demostramos experimentalmente que DFVEdit alcanza una velocidad de inferencia al menos 20 veces mayor y una reducción de memoria del 85 % en comparación con los métodos de edición basados en ingeniería de la atención, y se puede aplicar sin problemas a Video DiTs populares como CogVideoX y Wan2.1. Logra un rendimiento de vanguardia en términos de fidelidad estructural, coherencia espaciotemporal y calidad de edición.