Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

ĐáNh giá sự liên kết đa ngôn ngữ và chuyển đổi mã trong LLM thông qua suy luận ngôn ngữ tự nhiên tổng hợp

Created by
  • Haebom

Tác giả

Samir Abdaljalil, Erchin Serpedin, Khalid Qaraqe, Hasan Kurban

Phác thảo

Bài báo này trình bày một khuôn khổ đánh giá có kiểm soát để đánh giá khả năng của các mô hình ngôn ngữ quy mô lớn (LLM) trong việc xây dựng tính nhất quán một cách nhất quán và hợp lý trong môi trường đa ngôn ngữ. Chúng tôi tạo ra các cặp tiền đề-giả thuyết tổng hợp, dựa trên logic, được dịch sang một tập hợp các ngôn ngữ đa dạng về mặt hình thái và tiến hành các thử nghiệm trong cả điều kiện đơn ngữ và ngôn ngữ hỗn hợp (chuyển đổi mã). Chúng tôi chứng minh kết quả đáng ngạc nhiên rằng việc chuyển đổi mã có thể cải thiện hiệu suất thay vì làm giảm hiệu suất, cho thấy rằng những thay đổi từ vựng do bản dịch gây ra có thể đóng vai trò là tín hiệu điều chỉnh. Chúng tôi xác minh độ trung thực của các cặp đã dịch bằng cách sử dụng phân tích độ tương đồng dựa trên nhúng và trực quan hóa căn chỉnh liên ngôn ngữ. Tóm lại, chúng tôi chứng minh tiềm năng và lỗ hổng của suy luận liên ngôn ngữ hiện tại trong LLM và trình bày chuyển đổi mã như một phương pháp đầy hứa hẹn để cải thiện tính mạnh mẽ của đa ngôn ngữ.

Takeaways, Limitations

Takeaways:
Trình bày khuôn khổ kiểm soát để đánh giá NLI đa ngôn ngữ.
Chúng tôi chứng minh rằng việc chuyển đổi mã có thể góp phần cải thiện hiệu suất suy luận đa ngôn ngữ của LLM.
Đề Xuất rằng những thay đổi về mặt từ vựng do quá trình dịch thuật có thể đóng vai trò là tín hiệu điều chỉnh cho mô hình.
Nó đồng thời chứng minh tiềm năng và điểm yếu của khả năng lập luận liên ngôn ngữ của LLM.
Limitations:
ĐáNh giá dựa trên dữ liệu tổng hợp đòi hỏi phải xác minh khả năng khái quát hóa thành dữ liệu thực tế.
Cần nghiên cứu thêm để xác định khả năng khái quát hóa của kết quả đối với các bộ ngôn ngữ và LLM cụ thể.
Cần có một phân tích sâu hơn về tác động của việc chuyển đổi mã và xác định cơ chế của nó.
👍