[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Clasificación de subgéneros de referencia para la música de baile convencional

Created by
  • Haebom

Autor

Hongzhi Shu, Xinglin Li, Hongyu Jiang, Minghao Fu, Xinyu Li

Describir

Este artículo presenta un nuevo punto de referencia para la clasificación de subgéneros de la música dance convencional. Para abordar la falta de conjuntos de datos y metodologías eficaces, presentamos un nuevo conjunto de datos y un modelo de referencia que refleja la diversidad de las sesiones en vivo recientes de importantes DJs que actúan en festivales de música de todo el mundo. Para integrar pistas con subgéneros mixtos, adoptamos un enfoque de etiquetado suave continuo que preserva la complejidad de la música. Los resultados experimentales muestran que incluso los modelos de lenguaje multimodal a gran escala (MLLM) más avanzados presentan dificultades para realizar esta tarea, mientras que nuestro modelo de referencia especializado logra una alta precisión. El punto de referencia es compatible con aplicaciones como la recomendación musical, la planificación de sesiones de DJ y los sistemas multimedia interactivos, y se incluye una demostración en vídeo. El código y los datos están disponibles públicamente.

Takeaways, Limitations

Takeaways:
Proporcionar un nuevo punto de referencia y conjunto de datos para clasificar los subgéneros de la música de baile convencional.
Contribuye a la investigación de la música EDM con un rico conjunto de datos que abarca varios subgéneros.
Manejo eficaz de la complejidad de la música mediante técnicas de etiquetado suave continuo
Demuestra las limitaciones del MLLM de última generación y demuestra la superioridad de los modelos especializados.
Se puede utilizar en diversas aplicaciones, como recomendación musical y planificación de sesiones de DJ.
Garantizar la transparencia y reproducibilidad de la investigación mediante la divulgación del código y los datos
Limitations:
Se necesita más investigación sobre el tamaño y la diversidad del conjunto de datos.
Posibilidad de construir un conjunto de datos sesgado hacia un género o región específica
Es necesario considerar la subjetividad y las limitaciones de los métodos de etiquetado suave
Es necesaria una mayor validación del rendimiento de generalización del modelo de referencia propuesto.
👍