[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Classification comparative des sous-genres pour la musique de danse grand public

Created by
  • Haebom

Auteur

Hongzhi Shu, Xinglin Li, Hongyu Jiang, Minghao Fu, Xinyu Li

Contour

Cet article présente une nouvelle référence pour la classification des sous-genres de la musique dance grand public. Afin de pallier le manque de données existantes et de méthodologies efficaces, nous présentons un nouvel ensemble de données et un modèle de référence reflétant la diversité des concerts récents des principaux DJ se produisant lors de festivals internationaux. Pour prendre en compte les morceaux aux sous-genres variés, nous adoptons une approche d'étiquetage souple continu afin de préserver la complexité de la musique. Les résultats expérimentaux montrent que même les modèles de langage multimodaux à grande échelle (MLLM) les plus performants peinent à réaliser cette tâche, tandis que notre modèle de référence spécialisé atteint une grande précision. Ce modèle de référence prend en charge des applications telles que la recommandation musicale, la planification de sets DJ et les systèmes multimédias interactifs, et une démonstration vidéo est fournie. Le code et les données sont en libre accès.

Takeaways, Limitations

Takeaways:
Fournir une nouvelle référence et un nouvel ensemble de données pour classer les sous-genres de la musique de danse principale
Contribue à la recherche musicale EDM avec un riche ensemble de données couvrant divers sous-genres
Gérer efficacement la complexité de la musique grâce à des techniques d'étiquetage souple continu
Démontre les limites du MLLM de pointe et démontre la supériorité des modèles spécialisés
Peut être utilisé dans diverses applications telles que la recommandation musicale et la planification de sets de DJ
Assurer la transparence et la reproductibilité de la recherche par la divulgation du code et des données
Limitations:
Des recherches supplémentaires sont nécessaires sur la taille et la diversité de l’ensemble de données.
Possibilité de construire un ensemble de données biaisé en faveur d'un genre ou d'une région spécifique
Il faut tenir compte de la subjectivité et des limites des méthodes d’étiquetage souple
Une validation supplémentaire des performances de généralisation du modèle de base proposé est nécessaire.
👍