Este artículo se centra en lograr una generación de voz de alta calidad y adaptada a la infancia en diversos idiomas y contextos culturales, incluyendo idiomas con bajos recursos. Nuestro objetivo es aprovechar el potencial de los modelos generativos de voz, útiles en aplicaciones prácticas como el aprendizaje de idiomas para niños. Para ello, proponemos MultiGen, un modelo de generación de voz multilingüe que utiliza una arquitectura LLM adaptada a idiomas con bajos recursos. MultiGen busca facilitar la comunicación de los niños con sistemas de IA en contextos culturalmente apropiados, utilizando tres idiomas con bajos recursos: mandarín, malayo y tamil con acento singapurense. Los resultados experimentales, que incluyen métricas objetivas y evaluaciones subjetivas, demuestran que el MultiGen propuesto supera a los métodos de referencia.