[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Perception interne de la musique symbolique par les grands modèles de langage

Created by
  • Haebom

Auteur

Andrew Shin, Kunitake Kaneko

Contour

Cet article présente des recherches démontrant le potentiel des modèles de langage à grande échelle (MLL) pour s'étendre au-delà du langage naturel à d'autres domaines symboliques tels que le code et les mathématiques. Nous nous intéressons plus particulièrement à la manière dont les LLM représentent des concepts musicaux, génèrent des données musicales symboliques à partir d'invites textuelles (une combinaison de genres et de styles) et évaluent leur utilité par des tâches de reconnaissance et de génération. Nous créons un ensemble de données de fichiers MIDI générés par les LLM sans apprentissage musical explicite, entraînons un réseau neuronal sur cet ensemble de données et comparons ses performances à celles des modèles existants en effectuant des tâches de classification des genres et des styles et de complétion mélodique. Nos résultats montrent que les LLM peuvent déduire des structures musicales de base et des relations temporelles à partir du texte, mais révèlent également des limites dues à l'absence de contexte musical explicite. Par conséquent, nous apportons un éclairage sur les capacités de génération de musique symbolique des LLM.

Takeaways, Limitations

Takeaways:
Nous démontrons que LLM peut déduire la structure musicale de base et les relations temporelles à partir d’invites textuelles uniquement.
Suggérant la possibilité que LLM puisse être utilisé pour générer des données musicales sans formation musicale explicite.
Proposer de nouvelles directions de recherche en utilisant des ensembles de données de génération de musique basés sur LLM.
Limitations:
L’absence de contexte musical explicite limite la capacité du LLM à générer de la musique.
La qualité des données musicales générées par LLM peut être inférieure à celle des modèles musicaux existants.
Le manque de compréhension approfondie des mécanismes de production musicale par le LLM.
👍