Sign In

SFMS-ALR: Script-First Multilingual Speech Synthesis with Adaptive Locale Resolution

Created by
  • Haebom
Category
Empty

저자

Dharma Teja Donepudi

개요

본 논문은 문장 내 다국어 음성 합성(코드-스위칭 TTS)의 주요 과제를 해결하기 위해, 엔진 독립적인 프레임워크인 SFMS-ALR(Script-First Multilingual Synthesis with Adaptive Locale Resolution)을 제안합니다. SFMS-ALR은 유니코드 스크립트 기반 텍스트 분할, 적응형 언어 식별, 감성 기반의 운율 조정을 통해 언어 간의 부드러운 전환과 표현의 연속성을 유지하며, 기존 음성 합성 엔진과의 원활한 통합을 가능하게 합니다.

시사점, 한계점

시사점:
SFMS-ALR은 기존 음성 합성 엔진을 재훈련할 필요 없이 즉시 사용 가능하며, 유연성과 해석 가능성을 제공합니다.
다양한 언어 및 방언 환경에 쉽게 적용할 수 있습니다.
인텔리, 자연스러움, 사용자 선호도 평가를 위한 평가 전략을 제시합니다.
한계점:
본 논문에서는 한계점에 대한 직접적인 언급이 없습니다.
👍