Cet article se concentre sur la génération vocale de haute qualité, adaptée aux enfants, dans diverses langues et contextes culturels, y compris les langues à faibles ressources. Nous souhaitons exploiter le potentiel des modèles vocaux génératifs, utiles dans des applications pratiques telles que l'apprentissage des langues pour les enfants. À cette fin, nous proposons MultiGen, un modèle de génération vocale multilingue qui utilise une architecture LLM pour une génération vocale adaptée aux langues à faibles ressources. MultiGen vise à faciliter la communication des enfants avec les systèmes d'IA dans des contextes culturellement appropriés, en utilisant trois langues à faibles ressources : le mandarin, le malais et le tamoul avec un accent singapourien. Les résultats expérimentaux, incluant des mesures objectives et des évaluations subjectives, démontrent que le MultiGen proposé surpasse les méthodes de référence.