Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Aryabhata: Mô hình ngôn ngữ tập trung vào kỳ thi cho JEE Math

Created by
  • Haebom

Tác giả

Ritvik Rastogi, Sachin Dharashivkar, Sandeep Varma

Phác thảo

Aryabhata 1.0 là một mô hình suy luận toán học nhỏ với 7 tỷ tham số được tối ưu hóa cho kỳ thi tuyển sinh JEE của Ấn Độ. Trong khi các mô hình ngôn ngữ quy mô lớn (LLM) hiện có thường không đủ để đào tạo, Aryabhata 1.0 kết hợp các mô hình suy luận trọng số mở mạnh mẽ và được phát triển thông qua tinh chỉnh học có giám sát (SFT) và học tập chương trình giảng dạy bằng cách sử dụng theo dõi quá trình suy nghĩ đã được chứng minh (CoT). Nó cải thiện hiệu suất hơn nữa bằng cách áp dụng các chiến lược khám phá mới, chẳng hạn như Học tăng cường với phần thưởng có thể xác minh (RLVR) sử dụng mục tiêu A2C và ước tính lợi thế tương đối của nhóm, cũng như quy mô nhóm thích ứng và kiểm soát nhiệt độ. Nó vượt trội hơn các mô hình hiện có về độ chính xác và hiệu quả trên các điểm chuẩn trong phân phối như JEE Main 2025 và các điểm chuẩn ngoài phân phối như MATH và GSM8K, đồng thời cung cấp suy luận từng bước hữu ích về mặt giáo dục. Aryabhata 1.0 được phát hành như một mô hình nền tảng để phát triển các mô hình ngôn ngữ nhỏ tập trung vào bài kiểm tra, nguồn mở.

Takeaways, Limitations

Takeaways:
Thể hiện tiềm năng của một chương trình LLM nhỏ phù hợp với môi trường học tập chú trọng thi cử.
Thể hiện tính hữu ích trong giáo dục thông qua việc cung cấp khả năng lập luận mạnh mẽ và lập luận từng bước.
Nó được phát hành dưới dạng mã nguồn mở, đảm bảo khả năng đóng góp và phát triển của cộng đồng.
Nâng cao hiệu suất thông qua các chiến lược khám phá mới như ước tính lợi thế tương đối của nhóm và mục tiêu A2C, quy mô nhóm thích ứng và kiểm soát nhiệt độ.
_____T149256____:
Bài tập này chuyên dùng cho kỳ thi JEE và có thể có tính khái quát hạn chế đối với các loại bài toán hoặc môn học khác.
Vì mô hình nhỏ nên khả năng giải quyết các vấn đề phức tạp của nó có thể bị hạn chế.
Hiện tại, nó chỉ áp dụng riêng cho kỳ thi JEE ở Ấn Độ và khả năng áp dụng cho các quốc gia hoặc hệ thống giáo dục khác cần được nghiên cứu thêm.
👍