Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

DeepTrans: Dịch thuật suy luận sâu thông qua học tăng cường

Created by
  • Haebom

Tác giả

Jiaan Wang, Fandong Meng, Jie Chu

Phác thảo

Bài báo này trình bày DeepTrans, một mô hình dịch thuật tự do sử dụng các LLM suy luận sâu (ví dụ: OpenAI o1 và DeepSeek-R1). Chỉ ra rằng dịch thuật tự do chưa được nghiên cứu đầy đủ trong các LLM suy luận sâu hiện có, chúng tôi giới thiệu DeepTrans, một mô hình học dịch thuật tự do thông qua học tăng cường (RL). Sử dụng các tiêu chí đánh giá được xác định trước cho cả kết quả dịch thuật và quá trình tư duy, chúng tôi xây dựng một mô hình phần thưởng cho phép DeepTrans học cách suy luận và dịch thuật một cách tự do. Hơn nữa, nó loại bỏ nhu cầu về dữ liệu dịch thuật được gắn nhãn, tránh được nhiệm vụ tạo dữ liệu tốn nhiều công sức và tài nguyên. Kết quả thực nghiệm cho thấy DeepTrans, dựa trên Qwen2.5-7B, cải thiện hiệu suất dịch thuật văn học lên 16,3%, vượt trội hơn các LLM suy luận sâu mạnh mẽ hiện có. Chúng tôi cũng tóm tắt những thất bại và phát hiện thú vị từ quá trình khám phá RL.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một phương pháp mới để học dịch tự do không cần nhãn bằng cách sử dụng học tăng cường.
ĐạT được hiệu suất dịch thuật miễn phí được cải thiện so với các LLM suy luận sâu hiện có.
Thể hiện hiệu suất cải thiện trong các lĩnh vực chuyên môn như dịch thuật văn học.
Trình bày những khả năng mới trong nghiên cứu dịch thuật tự do.
Limitations:
Cần có thêm nghiên cứu về hiệu suất tổng quát của mô hình bồi thường được trình bày trong bài báo này.
Cần có thêm đánh giá hiệu suất cho các cặp ngôn ngữ khác nhau.
Cần nghiên cứu để cải thiện hiệu quả đào tạo RL.
Thiếu phân tích cụ thể về các trường hợp lỗi và phát hiện thú vị.
👍