[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

La percepción interna de la música simbólica en los grandes modelos lingüísticos

Created by
  • Haebom

Autor

Andrew Shin, Kunitake Kaneko

Describir

Este artículo analiza investigaciones que demuestran el potencial de los modelos de lenguaje a gran escala (LLM) para extenderse más allá del lenguaje natural a otros dominios simbólicos como el código y las matemáticas. En particular, nos centramos en cómo los LLM representan conceptos musicales, generan datos musicales simbólicos a partir de indicaciones textuales (una combinación de géneros y estilos) y evalúan su utilidad mediante tareas de reconocimiento y generación. Creamos un conjunto de datos de archivos MIDI generados por LLM sin entrenamiento musical explícito, entrenamos una red neuronal con este conjunto de datos y comparamos su rendimiento con modelos existentes mediante tareas de clasificación de género y estilo, y finalización de melodías. Nuestros resultados muestran que los LLM pueden inferir estructuras musicales básicas y relaciones temporales a partir del texto, pero también revelan limitaciones debido a la falta de contexto musical explícito. Como resultado, proporcionamos información sobre las capacidades de generación musical simbólica de los LLM.

Takeaways, Limitations

Takeaways:
Demostramos que LLM puede inferir la estructura musical básica y las relaciones temporales únicamente a partir de indicaciones de texto.
Sugerimos la posibilidad de que LLM se pueda utilizar para generar datos musicales sin entrenamiento musical explícito.
Sugerir nuevas direcciones de investigación utilizando conjuntos de datos de generación de música basados en LLM.
Limitations:
La falta de un contexto musical explícito limita la capacidad del LLM para generar música.
La calidad de los datos musicales generados por LLM puede ser inferior a la de los modelos musicales existentes.
La falta de comprensión profunda por parte del LLM de los mecanismos de producción musical.
👍