Este artículo propone Middo, un novedoso marco para el ajuste fino mediante aprendizaje supervisado (SFT) de modelos lingüísticos a gran escala (LLM). Para superar las limitaciones de los enfoques existentes basados en conjuntos de datos estáticos, Middo construye un sistema dinámico de optimización de datos que evoluciona en función del rendimiento del modelo. Mediante patrones de pérdida, la integración de dinámicas de clústeres y puntuaciones de autoalineación, Middo identifica muestras ineficientes y las transforma en valiosas para la educación. Este proceso mejora continuamente el conjunto de datos a medida que mejoran las capacidades del modelo, logrando una mejora promedio de la precisión del 7,15 % en múltiples experimentos de referencia. Esto presenta un nuevo paradigma para el aprendizaje sostenible de LLM mediante la coevolución dinámica de datos y modelos.