Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Mô hình ngôn ngữ tự hỏi

Created by
  • Haebom

Tác giả

Lili Chen, Mihir Prabhudesai, Katerina Fragkiadaki, Hảo Lưu, Deepak Pathak

Phác thảo

Bài báo này trình bày nghiên cứu về việc liệu các mô hình ngôn ngữ quy mô lớn có thể cải thiện hiệu suất bằng cách tạo ra các câu hỏi và câu trả lời một cách độc lập, mà không cần dữ liệu bên ngoài hay không. Để đạt được điều này, chúng tôi đề xuất một khuôn khổ tự học bất đối xứng được gọi là Mô hình Ngôn ngữ Tự Hỏi (SQLM). SQLM bao gồm một trình đề xuất tạo ra các câu hỏi và một trình giải tạo ra các câu trả lời, được huấn luyện thông qua học tăng cường. Trình đề xuất hướng đến việc tạo ra các bài toán có độ khó phù hợp, và trình giải được đánh giá là đúng thông qua biểu quyết đa số. Đối với các bài toán mã hóa, trình đề xuất tạo ra các bài kiểm tra đơn vị mà trình giải sẽ kiểm chứng. Chúng tôi đã tiến hành các thử nghiệm trên ba chuẩn: phép nhân ba chữ số, các bài toán đại số từ chuẩn OMEGA và các bài toán lập trình từ Codeforces, chứng minh sự cải thiện hiệu suất mà không cần dữ liệu bên ngoài.

Takeaways, Limitations

Takeaways:
Chúng tôi chứng minh rằng có thể cải thiện khả năng suy luận của các mô hình ngôn ngữ quy mô lớn mà không cần dữ liệu bên ngoài.
Trình bày phương pháp học tập hiệu quả về dữ liệu thông qua khuôn khổ tự học.
Khả năng áp dụng cho nhiều loại vấn đề khác nhau (toán học, mã hóa) đã được xác minh.
Limitations:
Sử dụng biểu quyết theo đa số làm tiêu chí để xác định câu trả lời đúng không phải là cách hoàn hảo để xác định câu trả lời đúng.
Hiệu suất của khuôn khổ đề xuất có thể khác nhau tùy theo tiêu chuẩn.
Nhu cầu xác minh chất lượng dữ liệu tự tạo.
👍