Middo는 모델 인식 데이터 선택과 맥락 보존 데이터 개선을 사용하는 자기 진화형 모델 기반 동적 데이터 최적화 프레임워크입니다. 정적 데이터 큐레이션의 한계를 극복하기 위해, 손실 패턴, 임베딩 클러스터 동역학, 자체 정렬 점수를 통해 하위 샘플을 식별하고, 이를 교육적으로 가치 있는 훈련 데이터로 변환합니다. 이 과정은 동적 학습 원리를 통해 모델 성능과 함께 지속적으로 발전하며, 여러 벤치마크에서 기존 데이터 품질을 향상시키고, LLM의 성능을 평균 7.15% 향상시켰습니다.