Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

MultiGen: Generador de voz multilingüe para niños con LLM

Created by
  • Haebom

Autor

Xiaoxue Gao, Huayun Zhang, Nancy F. Chen

Describir

Este artículo se centra en lograr una generación de voz de alta calidad y adaptada a la infancia en diversos idiomas y contextos culturales, incluyendo idiomas con bajos recursos. Nuestro objetivo es aprovechar el potencial de los modelos generativos de voz, útiles en aplicaciones prácticas como el aprendizaje de idiomas para niños. Para ello, proponemos MultiGen, un modelo de generación de voz multilingüe que utiliza una arquitectura LLM adaptada a idiomas con bajos recursos. MultiGen busca facilitar la comunicación de los niños con sistemas de IA en contextos culturalmente apropiados, utilizando tres idiomas con bajos recursos: mandarín, malayo y tamil con acento singapurense. Los resultados experimentales, que incluyen métricas objetivas y evaluaciones subjetivas, demuestran que el MultiGen propuesto supera a los métodos de referencia.

Takeaways, Limitations

Takeaways:
Se presenta un enfoque novedoso para modelos de generación de habla multilingüe adaptados a los niños en idiomas con bajos recursos.
Contribuir a la solución del problema de generación de voz para idiomas de bajos recursos utilizando la arquitectura LLM.
Presentando la posibilidad de interactuar con sistemas de IA adaptados a los niños que tienen en cuenta el contexto cultural.
Validación de la excelencia del modelo mediante evaluaciones objetivas y subjetivas.
Limitations:
Es necesario considerar la extensibilidad a otros idiomas además de los tres idiomas de bajos recursos utilizados en el artículo.
Se necesitan más investigaciones sobre la objetividad y generalización de los métodos de establecimiento de criterios y evaluación adaptados a los niños.
Falta de información detallada sobre el tamaño y la calidad de los datos de entrenamiento para los modelos MultiGen.
Ausencia de resultados de pruebas de usabilidad a largo plazo con usuarios infantiles reales.
👍