Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

MultiGen : Générateur de discours multilingue adapté aux enfants avec LLM

Created by
  • Haebom

Auteur

Xiaoxue Gao, Huayun Zhang, Nancy F. Chen

Contour

Cet article se concentre sur la génération vocale de haute qualité, adaptée aux enfants, dans diverses langues et contextes culturels, y compris les langues à faibles ressources. Nous souhaitons exploiter le potentiel des modèles vocaux génératifs, utiles dans des applications pratiques telles que l'apprentissage des langues pour les enfants. À cette fin, nous proposons MultiGen, un modèle de génération vocale multilingue qui utilise une architecture LLM pour une génération vocale adaptée aux langues à faibles ressources. MultiGen vise à faciliter la communication des enfants avec les systèmes d'IA dans des contextes culturellement appropriés, en utilisant trois langues à faibles ressources : le mandarin, le malais et le tamoul avec un accent singapourien. Les résultats expérimentaux, incluant des mesures objectives et des évaluations subjectives, démontrent que le MultiGen proposé surpasse les méthodes de référence.

Takeaways, Limitations_

Takeaways:
Une nouvelle approche des modèles de génération de parole multilingue adaptés aux enfants pour les langues à faibles ressources est présentée.
Contribuer à résoudre le problème de la génération de parole pour les langues à faibles ressources en utilisant l'architecture LLM.
Présenter la possibilité d’interagir avec des systèmes d’IA adaptés aux enfants qui prennent en compte le contexte culturel.
Validation de l'excellence du modèle par des évaluations objectives et subjectives.
Limitations:
Il est nécessaire de prendre en compte l’extensibilité vers d’autres langages que les trois langages à faibles ressources utilisés dans l’article.
Des recherches supplémentaires sont nécessaires sur l’objectivité et la généralisabilité des méthodes d’établissement de critères et d’évaluation adaptées aux enfants.
Manque d'informations détaillées sur la taille et la qualité des données de formation pour les modèles MultiGen.
Absence de résultats de tests d’utilisabilité à long terme avec des utilisateurs enfants réels.
👍