본 논문은 제어 가능한 감정 표현 TTS (Text-to-Speech)를 위해 기존의 이산적인 감정 라벨에 의존하는 방식의 한계를 극복하고자, 이산적 감정과 차원적 감정을 통합하는 신경 코덱 언어 모델인 UDDETTS를 제안합니다. UDDETTS는 해석 가능한 각성-지배-쾌락(ADV) 공간을 도입하여 차원적 감정을 설명하고, 이산적 감정 라벨 또는 비선형적으로 정량화된 ADV 값을 통해 감정 제어를 지원합니다. 또한, 다양한 유형의 감정 주석이 있는 음성 데이터셋을 포괄적으로 활용하기 위한 준지도 학습 전략을 설계하였습니다. 실험 결과, UDDDETTS는 ADV 공간의 세 차원에 따라 선형적인 감정 제어를 달성하고, 우수한 종단 간 감정적 음성 합성 성능을 보여줍니다.