Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

On the Joint Minimization of Regularization Loss Functions in Deep Variational Bayesian Methods for Attribute-Controlled Symbolic Music Generation

Created by
  • Haebom
Category
Empty

저자

Matteo Petteno, Alessandro Ilic Mezza, Alberto Bernardini

개요

명시적 잠재 변수 모델은 데이터 합성을 위한 유연하고 강력한 프레임워크를 제공하며, 생성 요소를 제어적으로 조작할 수 있게 해줍니다. 이러한 모델은 추적 가능한 확률 밀도 함수에서 추출된 잠재 변수를 활용하여, 잠재 공간을 탐색함으로써 출력 공간을 연속적이고 의미론적으로 풍부하게 탐색할 수 있게 합니다. 구조화된 잠재 표현은 일반적으로 정규화 손실 함수를 공동으로 최소화하여 얻습니다. 특히, 변동 정보 병목 모델에서는 재구성 손실과 쿨백-라이블러 발산(KLD)이 보조 속성 정규화(AR) 손실과 함께 선형적으로 결합됩니다. 그러나 KLD와 AR의 균형을 맞추는 것은 매우 섬세한 문제입니다. KLD가 AR보다 지배적일 경우, 생성 모델은 제어력이 부족해지는 경향이 있으며, AR이 KLD보다 지배적일 경우, 확률적 인코더는 표준 정규 사전 확률을 위반하도록 유도됩니다. 이 연구에서는 연속적인 음악적 속성에 대한 명시적인 제어를 통해 기호 음악 생성의 맥락에서 이러한 상충 관계를 탐구합니다. 기존 접근 방식이 두 정규화 목표를 공동으로 최소화하는 데 어려움을 겪는 반면, 적절한 속성 변환이 목표 잠재 차원의 제어력과 정규화를 모두 달성하는 데 도움이 될 수 있음을 보여줍니다.

시사점, 한계점

시사점:
잠재 변수 모델을 사용하여 음악적 속성을 제어하는 생성 모델을 개발할 수 있습니다.
속성 변환을 통해 제어력과 정규화를 모두 향상시킬 수 있습니다.
한계점:
KLD와 AR의 균형을 맞추는 것이 어려울 수 있습니다.
기존 접근 방식이 두 목표를 모두 최적화하는 데 어려움을 겪습니다.
👍