Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới. Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận. Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.
Tại sao các chương trình Thạc sĩ Luật Nguồn mở lại gặp khó khăn trong việc phân tích dữ liệu? Một nghiên cứu thực nghiệm có hệ thống
Created by
Haebom
Tác giả
Yuqi Zhu, Yi Zhong, Jintian Zhang, Ziheng Zhang, Shuofei Qiao, Yujie Luo, Lun Du, Da Zheng, Ningyu Zhang, Huajun Chen
Phác thảo
Bài báo này khám phá các chiến lược nhằm cải thiện khả năng phân tích dữ liệu của một mô hình ngôn ngữ quy mô lớn (LLM) nguồn mở. Sử dụng một tập dữ liệu hạt giống bao gồm nhiều kịch bản thực tế khác nhau, chúng tôi đánh giá hiệu suất của mô hình trên ba khía cạnh chính: hiểu dữ liệu, tạo mã và lập kế hoạch chiến lược. Phân tích của chúng tôi cho thấy ba phát hiện chính: chất lượng lập kế hoạch chiến lược là yếu tố quyết định chính đến hiệu suất của mô hình; thiết kế tương tác và độ phức tạp của tác vụ ảnh hưởng đáng kể đến hiệu suất suy luận; và chất lượng dữ liệu có tác động lớn hơn tính đa dạng trong việc đạt được hiệu suất tối ưu. Dựa trên những hiểu biết này, chúng tôi phát triển một phương pháp tổng hợp dữ liệu để cải thiện đáng kể khả năng suy luận phân tích của LLM nguồn mở. Mã nguồn có thể được tìm thấy tại https://github.com/zjunlp/DataMind .