Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

LoopGen: Generación de música en bucle sin entrenamiento

Created by
  • Haebom

Autor

Davide Marincione, Giorgio Strano, Donato Crisostomi, Roberto Ribuoli, Emanuele Rodol a

Describir

Este artículo se centra en la generación de bucles (segmentos de audio cortos repetidos), un elemento importante en los géneros de música dance y electrónica. Los modelos de generación existentes presentan el problema de que no pueden garantizar transiciones fluidas entre el inicio y el final generando únicamente formas de onda cortas, lo que resulta en discontinuidades. Este estudio resuelve este problema modificando un modelo no autorregresivo (MAGNeT) para generar tokens en un patrón cíclico, de modo que el modelo se centre en el inicio al generar el final. La generación natural de bucles solo es posible por inferencia, sin aprendizaje ni datos adicionales, y se confirman mejoras subjetivas en la calidad, como una mejora del 55 % en la perplejidad de los tokens en la parte de conexión del bucle y una mejora del 70 % en la calificación promedio en las pruebas de escucha. Esto demuestra la eficacia de un enfoque basado en la inferencia y las ventajas de un modelo no autorregresivo.

Takeaways, Limitations

Takeaways:
Demostramos que es posible generar música en bucle natural utilizando un enfoque basado en inferencia que utiliza modelos no autorregresivos.
Resuelve eficazmente el problema de discontinuidad en la sección de conexión del bucle, contribuyendo a mejorar la calidad del sonido.
Lograr mejoras de rendimiento sin datos de entrenamiento adicionales, lo que sugiere la posibilidad de un aprendizaje eficiente del modelo.
Se presenta un nuevo enfoque para mejorar el rendimiento de los modelos generativos.
Limitations:
Los resultados se limitan a un modelo no autorregresivo específico (MAGNeT), y se necesita más investigación para determinar su generalización a otros modelos.
Falta de análisis de las diferencias de rendimiento según la longitud de los bucles y los géneros musicales.
Basado en resultados de pruebas a escala limitada en lugar de pruebas de escucha a gran escala.
Se necesita más investigación para explorar su aplicabilidad a diferentes estilos y complejidades musicales.
👍