Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Middo: Tối ưu hóa dữ liệu động dựa trên mô hình để tinh chỉnh LLM nâng cao thông qua học tập vòng kín

Created by
  • Haebom

Tác giả

Zinan Tang, Xin Gao, Qizhi Pei, Zhuoshi Pan, Mengzhang Cai, Jiang Wu, Conghui He, Lijun Wu

Phác thảo

Bài báo này đề xuất Middo, một khuôn khổ mới cho việc tinh chỉnh học có giám sát (SFT) các mô hình ngôn ngữ quy mô lớn (LLM). Để khắc phục những hạn chế của các phương pháp tiếp cận dựa trên tập dữ liệu tĩnh hiện có, Middo xây dựng một hệ thống tối ưu hóa dữ liệu động, phát triển dựa trên hiệu suất mô hình. Sử dụng các mẫu mất mát, động lực học cụm nhúng và điểm tự căn chỉnh, Middo xác định các mẫu không hiệu quả và chuyển đổi chúng thành các mẫu có giá trị giáo dục. Quá trình này liên tục cải thiện tập dữ liệu khi khả năng của mô hình được cải thiện, đạt được mức cải thiện độ chính xác trung bình là 7,15% qua nhiều thử nghiệm chuẩn. Điều này mở ra một mô hình mới cho việc học LLM bền vững thông qua sự đồng tiến hóa năng động của dữ liệu và mô hình.

Takeaways, Limitations

Takeaways:
Chúng tôi cải thiện đáng kể hiệu quả học tập LLM bằng cách trình bày một hệ thống tối ưu hóa dữ liệu động liên tục phát triển khi hiệu suất mô hình được cải thiện.
Chúng tôi khắc phục những hạn chế của SFT dựa trên tập dữ liệu tĩnh hiện có và đề xuất phương pháp học LLM hiệu quả hơn.
Chúng tôi trình bày một phương pháp mới để đánh giá và cải thiện chất lượng dữ liệu bằng cách tận dụng nhiều tín hiệu mô hình khác nhau.
Chúng tôi đã xác minh hiệu quả của Middo thông qua kết quả thử nghiệm cho thấy độ chính xác được cải thiện trung bình là 7,15%.
Chúng tôi trình bày một mô hình học tập LLM bền vững thông qua sự phát triển lẫn nhau của dữ liệu và mô hình.
Limitations:
Việc xác minh khả năng tái tạo rất khó khăn vì tập dữ liệu, mô hình và mã hiện tại không được công khai.
Hiệu suất tổng quát hóa trên nhiều LLM và nhiệm vụ khác nhau vẫn chưa được xác thực đầy đủ.
Thiếu phân tích về độ phức tạp và chi phí tính toán của khuôn khổ Middo.
👍