명시적 잠재 변수 모델은 데이터 합성을 위한 유연하고 강력한 프레임워크를 제공하며, 생성 요소를 제어적으로 조작할 수 있게 해줍니다. 이러한 모델은 추적 가능한 확률 밀도 함수에서 추출된 잠재 변수를 활용하여, 잠재 공간을 탐색함으로써 출력 공간을 연속적이고 의미론적으로 풍부하게 탐색할 수 있게 합니다. 구조화된 잠재 표현은 일반적으로 정규화 손실 함수를 공동으로 최소화하여 얻습니다. 특히, 변동 정보 병목 모델에서는 재구성 손실과 쿨백-라이블러 발산(KLD)이 보조 속성 정규화(AR) 손실과 함께 선형적으로 결합됩니다. 그러나 KLD와 AR의 균형을 맞추는 것은 매우 섬세한 문제입니다. KLD가 AR보다 지배적일 경우, 생성 모델은 제어력이 부족해지는 경향이 있으며, AR이 KLD보다 지배적일 경우, 확률적 인코더는 표준 정규 사전 확률을 위반하도록 유도됩니다. 이 연구에서는 연속적인 음악적 속성에 대한 명시적인 제어를 통해 기호 음악 생성의 맥락에서 이러한 상충 관계를 탐구합니다. 기존 접근 방식이 두 정규화 목표를 공동으로 최소화하는 데 어려움을 겪는 반면, 적절한 속성 변환이 목표 잠재 차원의 제어력과 정규화를 모두 달성하는 데 도움이 될 수 있음을 보여줍니다.