본 논문은 저자원 언어를 포함한 다양한 언어와 문화적 배경에서 아동 친화적인 고품질 음성 생성을 달성하는 데 초점을 맞추고 있습니다. 특히 어린이들의 언어 학습과 같은 실제 응용 분야에서 유용성을 가진 생성 음성 모델의 잠재력을 활용하고자 합니다. 이를 위해 저자들은 저자원 언어에 맞춤화된 음성 생성을 위한 LLM 아키텍처를 활용하는 다국어 음성 생성 모델인 MultiGen을 제안합니다. MultiGen은 싱가포르식 악센트의 만다린, 말레이어, 타밀어 등 세 가지 저자원 언어를 통해 문화적으로 적절한 맥락에서 어린이들의 AI 시스템과의 의사소통을 촉진하는 것을 목표로 합니다. 객관적 지표와 주관적 평가를 통한 실험 결과는 제안된 MultiGen이 기준 방법보다 우수한 성능을 보임을 입증합니다.