Bài báo này nghiên cứu về Dịch máy Tăng cường Truy xuất (RAG-MT) sử dụng tài liệu phi cấu trúc. Trong khi các nghiên cứu trước đây chủ yếu cải thiện hiệu suất của các LLM bằng cách truy xuất thông tin từ các tập hợp ngữ liệu dịch máy theo cặp hoặc đồ thị tri thức, bài báo này tập trung vào việc tận dụng kho tàng tri thức toàn cầu khổng lồ có sẵn trong các tài liệu phi cấu trúc trên nhiều ngôn ngữ khác nhau. Để đạt được điều này, các nhà nghiên cứu đã xây dựng một chuẩn mực mới, RAGtrans, bao gồm 169.000 mẫu dịch máy và tài liệu đa ngôn ngữ, sử dụng GPT-4 và các biên dịch viên là con người. Hơn nữa, họ đề xuất một phương pháp học đa tác vụ, đào tạo các LLM sử dụng thông tin từ các tập hợp ngữ liệu đa ngôn ngữ hiện có mà không cần thêm nhãn. Kết quả thực nghiệm chứng minh rằng phương pháp được đề xuất cải thiện đáng kể điểm BLEU và COMET cho các bản dịch Anh-Trung và Anh-Đức. Cuối cùng, chúng tôi phân tích những thách thức mà các LLM hiện tại phải đối mặt trong các nhiệm vụ này.