Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Các LLM đa ngôn ngữ không phải là những người tư duy đa ngôn ngữ: Bằng chứng từ Đánh giá phép loại suy tiếng Hindi

Created by
  • Haebom

Tác giả

Ashray Gupta, Rohan Joseph, Sunny Rai

Phác thảo

Trong bài báo này, chúng tôi đề xuất một chuẩn mực mới, Bộ Kiểm tra Tương tự Tiếng Hindi (HATS), để đánh giá khả năng lập luận của các mô hình ngôn ngữ quy mô lớn (LLM) cho tiếng Hindi, một ngôn ngữ Ấn Độ. HATS bao gồm 405 câu hỏi trắc nghiệm được lấy từ các kỳ thi của chính phủ Ấn Độ và đánh giá các LLM đa ngôn ngữ tiên tiến bằng nhiều chiến lược gợi ý khác nhau. Đặc biệt, chúng tôi đề xuất một phương pháp tiếp cận Chuỗi Tư duy có cơ sở, tận dụng lý thuyết tương tự nhận thức để cải thiện hiệu suất mô hình đối với các bài toán tương tự tiếng Hindi. Kết quả thực nghiệm cho thấy hiệu suất mô hình tốt nhất khi sử dụng gợi ý tiếng Anh, bất kể chiến lược gợi ý nào. Nghiên cứu này giải quyết vấn đề thiếu hụt nguồn lực quan trọng để đánh giá khả năng lập luận của LLM tiếng Hindi.

Takeaways, Limitations

Takeaways:
Cung cấp chuẩn mực mới (HATS) để đánh giá khả năng lập luận của LLM bằng tiếng Ấn Độ bao gồm tiếng Hindi.
Cải thiện kỹ năng giải quyết vấn đề tương tự bằng tiếng Hindi trong LLM thông qua phương pháp tiếp cận chuỗi tư duy cơ bản.
Nâng cao hiểu biết về khả năng khái quát hóa ngôn ngữ của các chương trình LLM đa ngôn ngữ.
Kiểm tra hiệu quả của lời nhắc bằng tiếng Anh.
Limitations:
HATS dựa trên các câu hỏi trong kỳ thi của Chính phủ Ấn Độ và do đó có thể không phản ánh hoàn hảo các câu hỏi tương tự thông thường bằng tiếng Hindi.
Nghiên cứu hiện tại chỉ giới hạn ở một LLM cụ thể và chiến lược thúc đẩy, hạn chế khả năng khái quát hóa sang các mô hình hoặc chiến lược khác.
Cần có thêm phân tích và lý giải về tính ưu việt của câu hỏi tiếng Anh.
👍