Este estudio presenta un marco mejorado de red de operadores profundos de multifidelidad (DeepONet) para la predicción eficiente de campos de flujo espaciotemporales en situaciones donde los datos de alta fidelidad son escasos. Las innovaciones clave incluyen: una red de fusión que reemplaza la operación tradicional de producto escalar, lo que reduce el error de predicción en un 50,4 %, mejora la precisión en un 7,57 % y reduce el tiempo de entrenamiento en un 96 %; un enfoque de multifidelidad basado en aprendizaje por transferencia que fija la red de baja fidelidad preentrenada y entrena solo la red de fusión, lo que logra un rendimiento hasta un 76 % mejor que los métodos existentes y una precisión un 43,7 % mayor que el entrenamiento de fidelidad simple; y un método de submuestreo basado en la física que selecciona estratégicamente puntos de entrenamiento de alta fidelidad según la dinámica temporal, lo que reduce el requisito de muestra de alta fidelidad en un 40 % manteniendo una precisión similar. Experimentos exhaustivos en varias resoluciones y conjuntos de datos demuestran que el marco propuesto puede reducir significativamente el tamaño del conjunto de datos de alta fidelidad requerido y, al mismo tiempo, mantener la precisión de la predicción y superar sistemáticamente los modelos de referencia existentes.