Bài báo này đề xuất Middo, một khuôn khổ mới cho việc tinh chỉnh học có giám sát (SFT) các mô hình ngôn ngữ quy mô lớn (LLM). Để khắc phục những hạn chế của các phương pháp tiếp cận dựa trên tập dữ liệu tĩnh hiện có, Middo xây dựng một hệ thống tối ưu hóa dữ liệu động, phát triển dựa trên hiệu suất mô hình. Sử dụng các mẫu mất mát, động lực học cụm nhúng và điểm tự căn chỉnh, Middo xác định các mẫu không hiệu quả và chuyển đổi chúng thành các mẫu có giá trị giáo dục. Quá trình này liên tục cải thiện tập dữ liệu khi khả năng của mô hình được cải thiện, đạt được mức cải thiện độ chính xác trung bình là 7,15% qua nhiều thử nghiệm chuẩn. Điều này mở ra một mô hình mới cho việc học LLM bền vững thông qua sự đồng tiến hóa năng động của dữ liệu và mô hình.