Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Suy luận chuỗi suy nghĩ dài xuyên ngôn ngữ

Created by
  • Haebom

Tác giả

Josh Barua, Seun Eisape, Kayo Yin, Alane Suhr

Phác thảo

Bài báo này khám phá phần mở rộng đa ngôn ngữ của các quá trình suy nghĩ dạng dài (CoT), góp phần cải thiện hiệu suất suy luận của các mô hình ngôn ngữ quy mô lớn (LLM). Chúng tôi đã tinh chỉnh các mô hình Qwen 2.5 (7B) và Qwen 3 (8B) bằng cách sử dụng hai tập dữ liệu suy luận dựa trên tiếng Anh được dịch sang tiếng Pháp, tiếng Nhật, tiếng Latvia và tiếng Swahili. Các thí nghiệm cho thấy hiệu quả của việc sử dụng tiếng Anh làm ngôn ngữ cầu nối khác nhau giữa các ngôn ngữ (không hiệu quả đối với tiếng Pháp, hiệu quả đối với tiếng Nhật và tiếng Latvia và yếu đối với tiếng Swahili). Hơn nữa, việc tiền đào tạo đa ngôn ngữ rộng rãi trong Qwen 3 đã giảm, nhưng không loại bỏ hoàn toàn, khoảng cách hiệu suất giữa các ngôn ngữ. Chỉ riêng việc tinh chỉnh trên một tập dữ liệu nhỏ (1k dấu vết) đã cải thiện hiệu suất trong tiếng Swahili hơn 30%. Cuối cùng, sự đánh đổi giữa chất lượng dữ liệu và quy mô khác nhau giữa các ngôn ngữ: tiếng Anh và tiếng Pháp được hưởng lợi từ các tập dữ liệu nhỏ hơn, tinh chỉnh hơn, trong khi tiếng Swahili và tiếng Latvia được hưởng lợi từ các tập dữ liệu lớn hơn, nhiễu hơn. Những kết quả này làm rõ cách thức và lý do tại sao các CoT dài được chuyển giao qua nhiều ngôn ngữ và cung cấp một tập dữ liệu đã dịch cho các nghiên cứu suy luận đa ngôn ngữ công bằng.

Takeaways, Limitations

Takeaways:
Hiệu quả của việc sử dụng tiếng Anh như một ngôn ngữ trung gian khác nhau tùy theo ngôn ngữ.
Chúng tôi trình bày tầm quan trọng của việc học từ điển đa ngôn ngữ và hiệu quả của việc tinh chỉnh trên các tập dữ liệu nhỏ.
Chúng tôi chứng minh rằng sự đánh đổi giữa chất lượng dữ liệu và quy mô khác nhau tùy theo ngôn ngữ.
Cung cấp các tập dữ liệu đã dịch cho nghiên cứu suy luận đa ngôn ngữ.
Limitations:
Số lượng ngôn ngữ được sử dụng trong nghiên cứu còn hạn chế.
Có khả năng kết quả chỉ giới hạn ở một mô hình LLM cụ thể.
Cần có thêm nghiên cứu về khả năng khái quát hóa cho các loại nhiệm vụ lập luận khác nhau.
👍