Bài báo này tập trung vào việc đạt được khả năng tạo giọng nói chất lượng cao, thân thiện với trẻ em trên nhiều ngôn ngữ và nền văn hóa khác nhau, bao gồm cả các ngôn ngữ có nguồn lực hạn chế. Chúng tôi mong muốn tận dụng tiềm năng của các mô hình tạo giọng nói, vốn hữu ích trong các ứng dụng thực tế như học ngôn ngữ cho trẻ em. Vì mục đích này, chúng tôi đề xuất MultiGen, một mô hình tạo giọng nói đa ngôn ngữ sử dụng kiến trúc LLM để tạo giọng nói phù hợp với các ngôn ngữ có nguồn lực hạn chế. MultiGen hướng đến việc tạo điều kiện thuận lợi cho trẻ em giao tiếp với các hệ thống AI trong các bối cảnh phù hợp về mặt văn hóa, sử dụng ba ngôn ngữ có nguồn lực hạn chế: tiếng Quan Thoại, tiếng Mã Lai và tiếng Tamil với giọng Singapore. Kết quả thử nghiệm, bao gồm các số liệu khách quan và đánh giá chủ quan, chứng minh rằng MultiGen được đề xuất vượt trội hơn các phương pháp cơ bản.