Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Moonbeam: A MIDI Foundation Model Using Both Absolute and Relative Music Attributes

Created by
  • Haebom

저자

Zixun Guo, Simon Dixon

개요

Moonbeam은 81.6K 시간 분량의 음악과 180억 개의 토큰으로 구성된 방대한 MIDI 데이터셋으로 사전 학습된, 변환기 기반의 음악 기초 모델입니다. 새로운 도메인 지식 기반 토큰화 방법과 추가 학습 매개변수 없이 상대적인 음악 정보를 포착하는 다차원 상대적 어텐션(MRA)을 통해 절대적 및 상대적 음악 속성을 모두 포착함으로써 음악 도메인의 귀납적 편향을 통합합니다. 사전 학습된 Moonbeam을 활용하여, 음악 이해 및 조건부 음악 생성(음악 채우기 포함)이라는 두 가지 하위 작업을 목표로 하는 완전한 예측 능력을 갖춘 2가지 미세 조정 아키텍처를 제안합니다. 4개의 데이터셋에서 3가지 하위 음악 분류 작업에 대한 정확도와 F1 점수 측면에서 대부분의 경우 다른 대규모 사전 학습된 음악 모델보다 성능이 우수합니다. 또한, 미세 조정된 조건부 음악 생성 모델은 REMI 유사 토큰화기를 사용하는 강력한 변환기 기준 모델보다 성능이 우수합니다. 코드, 사전 학습된 모델 및 생성된 샘플을 Github에서 공개합니다.

시사점, 한계점

시사점:
대규모 MIDI 데이터셋을 사용한 변환기 기반 음악 기초 모델의 성공적인 개발.
MRA를 통해 효율적으로 상대적 음악 정보를 포착.
음악 이해 및 생성 작업에서 기존 모델들을 능가하는 성능 달성.
코드와 사전 학습된 모델의 공개를 통한 연구의 재현성 및 확장성 제고.
한계점:
특정 데이터셋에 대한 성능 평가로 일반화 성능에 대한 추가 검증 필요.
MRA의 효과에 대한 더 자세한 분석 및 다른 상대적 어텐션 기법과의 비교 필요.
다양한 음악 장르 및 스타일 전반의 일반화 성능에 대한 추가 연구 필요.
👍