Bài báo này trình bày KHUNG DỊCH THUẬT TINYFABULIST (TF2), một khung tích hợp cho dịch thuật văn học sang tiếng Rumani, ngôn ngữ ít tài nguyên. TF2 là một khung tích hợp cho việc tạo, tinh chỉnh và đánh giá tập dữ liệu, tập trung vào việc tạo và phát hành một mô hình ngôn ngữ tinh chỉnh nén (TF2-12B) và các tập dữ liệu song song tổng hợp quy mô lớn (DS-TF2-EN-RO-3M và DS-TF2-EN-RO-15K). Dựa trên tập dữ liệu truyện ngụ ngôn tiếng Anh tổng hợp quy mô lớn hiện có (DS-TF1-EN-3M), chúng tôi tạo ra 15.000 mục dữ liệu tham chiếu tiếng Rumani chất lượng cao và tinh chỉnh mô hình bằng cách sử dụng tinh chỉnh chỉ thị và nén bộ điều hợp trên một mô hình trọng số mở 12 tỷ tham số. Đánh giá được thực hiện bằng cách kết hợp BLEU cấp ngữ liệu và một thước đo đánh giá năm chiều dựa trên LLM (độ chính xác, độ trôi chảy, độ mạch lạc, phong cách và sự thích nghi văn hóa). Kết quả thử nghiệm cho thấy mô hình được tinh chỉnh đạt được độ trôi chảy và độ liên quan tương đương với các mô hình độc quyền quy mô lớn hiệu suất cao nhất, đồng thời vẫn đảm bảo tính mã nguồn mở, dễ tiếp cận và tiết kiệm chi phí. Mô hình, tập dữ liệu, tập lệnh và lời nhắc đánh giá đều được công khai.