Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SingMOS-Pro: An Comprehensive Benchmark for Singing Quality Assessment

Created by
  • Haebom

저자

Yuxun Tang, Lan Liu, Wenhao Feng, Yiwen Zhao, Jionghao Han, Yifeng Yu, Jiatong Shi, Qin Jin

SingMOS-Pro: 자동 노래 품질 평가를 위한 데이터셋

개요

본 연구는 노래 음성 생성 기술의 발전에 따라, 노래 품질 평가의 중요성을 강조하며, 자동 노래 품질 평가를 위한 데이터셋 SingMOS-Pro를 소개한다. SingMOS-Pro는 기존 SingMOS의 확장 버전으로, 전반적인 품질 외에도 가사, 멜로디, 전반적인 품질에 대한 주석을 포함하여 더 넓은 범위와 다양성을 제공한다. 41개의 모델과 12개의 데이터셋에서 생성된 7,981개의 노래 클립을 포함하며, 각 클립은 전문 주석가로부터 5개 이상의 평점을 받았다. 또한, 다양한 표준으로 주석된 MOS 데이터를 효과적으로 활용하는 방법을 탐구하고, SingMOS-Pro에서 널리 사용되는 평가 방법을 벤치마킹하여 향후 연구를 위한 강력한 기준과 실용적인 참고 자료를 제공한다. 데이터셋은 https://huggingface.co/datasets/TangRain/SingMOS-Pro 에서 접근 가능하다.

시사점, 한계점

시사점:
자동 노래 품질 평가 연구를 위한 새로운 데이터셋 SingMOS-Pro를 제공한다.
가사, 멜로디, 전반적인 품질을 포함한 다양한 주석을 제공하여 포괄적인 평가를 가능하게 한다.
다양한 모델과 데이터셋에서 생성된 방대한 양의 노래 클립을 포함한다.
전문 주석가의 평점을 통해 신뢰성과 일관성을 확보했다.
다양한 MOS 데이터 활용 방법을 탐구하고 벤치마킹을 수행하여 기준을 제시한다.
한계점:
논문 자체에서 구체적인 한계점 언급은 없다.
👍