Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới. Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận. Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.
Khoa học xuyên ngôn ngữ: Đánh giá bản dịch đa ngôn ngữ của các bài báo khoa học LLM
Created by
Haebom
Tác giả
Hannah Calzi Kleidermacher, James Zou
Phác thảo
Bài báo này đề cập đến thực tế là hầu hết các tạp chí học thuật chỉ được xuất bản bằng tiếng Anh, gây ra rào cản cho những người không phải là người bản ngữ nói tiếng Anh. Bài báo này đề xuất một hệ thống dịch tự động cho các bài báo học thuật sử dụng mô hình ngôn ngữ quy mô lớn (LLM). Trong khi vẫn duy trì định dạng JATS XML, chúng tôi đã dịch các bài báo từ nhiều lĩnh vực khoa học khác nhau sang 28 ngôn ngữ và đo độ chính xác của bản dịch (trung bình 95,9%) bằng phương pháp đánh giá dựa trên câu hỏi trả lời (QA) độc đáo. Một nghiên cứu người dùng với 15 nhà nghiên cứu đã xác nhận độ chính xác của bản dịch và cũng cho thấy sự khác biệt trong sở thích dịch quá mức của một số thuật ngữ kỹ thuật. Hơn nữa, chúng tôi chứng minh khả năng thích ứng và tính hữu ích của bản dịch dựa trên LLM bằng cách sử dụng các kỹ thuật học theo ngữ cảnh để giảm thiểu vấn đề dịch quá mức. Mã nguồn và các bài báo đã dịch có sẵn tại _____T31356____- .
Takeaways, Limitations
•
Takeaways:
◦
Trình bày tính khả thi của hệ thống dịch tự động cho các bài báo học thuật sử dụng LLM.
◦
Tăng khả năng áp dụng vào các tạp chí học thuật thực tế bằng cách duy trì định dạng JATS XML.
◦
ĐáNh giá khách quan độ chính xác của bản dịch thông qua phương pháp đánh giá dựa trên câu hỏi và trả lời.
◦
Khả năng truy cập rộng rãi thông qua hỗ trợ nhiều ngôn ngữ (28 ngôn ngữ).
◦
Cải thiện chất lượng bản dịch và cung cấp khả năng tùy chỉnh cho người dùng thông qua tính năng học theo ngữ cảnh.
•
Limitations:
◦
Có quá nhiều vấn đề về dịch thuật đối với một số thuật ngữ kỹ thuật và cần phải điều chỉnh thêm dựa trên sở thích của người dùng.
◦
Quy mô nghiên cứu người dùng tương đối nhỏ (15 người).
◦
Cần nghiên cứu thêm để xác định xem có sự thiên vị trong các lĩnh vực cụ thể hay không.