本論文は、低資源言語を含む多様な言語と文化的背景で子供に優しい高品質の音声生成を達成することに焦点を当てています。特に、子供たちの言語学習など、実際のアプリケーションで有用性を持つ生成音声モデルの可能性を活用したいと思います。そのために、著者は、低資源言語にカスタマイズされた音声生成のためのLLMアーキテクチャを利用する多言語音声生成モデルであるMultiGenを提案します。 MultiGenは、シンガポールのアクセントのマンダリン、マレー語、タミル語の3つの低資源言語を通じて、文化的に適切な文脈で子供たちのAIシステムとのコミュニケーションを促進することを目指しています。客観的指標と主観的評価による実験結果は、提案されたMultiGenが基準方法より優れた性能を示すことを実証している。