Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Explicit Tonal Tension Conditioning via Dual-Level Beam Search for Symbolic Music Generation

Created by
  • Haebom
Category
Empty

저자

Maral Ebrahimzadeh, Gilberto Bernardes, Sebastian Stober

개요

최첨단 기호 음악 생성 모델은 뛰어난 출력 품질을 달성했지만, 음조 긴장감과 같은 작곡적 특징을 명시적으로 제어하는 것은 여전히 어렵다. 본 논문에서는 음정 벡터 분석에 기반한 계산적 음조 긴장도 모델을 Transformer 프레임워크에 통합하는 새로운 접근 방식을 제안한다. 이 방법은 추론 과정에서 2단계 빔 서치 전략을 사용한다. 토큰 수준에서는 모델 확률과 다양성 지표를 사용하여 생성된 후보를 재정렬하여 전반적인 품질을 유지한다. 마디 수준에서는 긴장도 곡선에 맞춰 생성된 음악을 정렬하기 위해 긴장도 기반 재정렬을 적용한다. 객관적 평가는 제안된 접근 방식이 음조 긴장도를 효과적으로 조절함을 보여주며, 주관적인 청취 테스트는 시스템이 목표 긴장도에 맞춰 출력을 생성한다는 것을 확인한다. 이러한 결과는 이중 수준 빔 서치를 통한 명시적 긴장도 조건화가 AI 생성 음악을 안내하는 강력하고 직관적인 도구를 제공한다는 것을 보여준다. 또한, 동일한 긴장도 조건 하에서 여러 개의 뚜렷한 음악적 해석을 생성할 수 있음을 실험을 통해 입증했다.

시사점, 한계점

음조 긴장도 제어를 Transformer 기반 음악 생성 모델에 통합하는 새로운 방법 제시
이중 수준 빔 서치를 통해 모델의 긴장도 조절 능력 향상
객관적 및 주관적 평가를 통해 방법론의 효과 입증
동일한 긴장도 조건 하에서 다양한 음악적 해석 생성 가능성 제시
명시적인 한계점은 논문에서 언급되지 않음
👍