Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Inversión de compresión de rango dinámico mejorada neuronalmente: un enfoque híbrido para restaurar la dinámica del audio

Created by
  • Haebom

Autor

Haoran Sun, Dominique Fourer, Hichem Maaref

Describir

Este artículo presenta un enfoque híbrido que combina la transformada inversa basada en modelos y redes neuronales para resolver el problema de la transformada inversa de la compresión del rango dinámico (DRC). Para superar las limitaciones de los métodos existentes, que ignoran parámetros clave o se basan en valores precisos de los mismos, utilizamos redes neuronales (clasificación y regresión) para estimar los parámetros de la DRC y reconstruir la señal original. Los resultados experimentales con diversos conjuntos de datos de música y voz demuestran que el método propuesto supera a las técnicas más avanzadas en rendimiento y robustez.

Takeaways, Limitations

Takeaways:
Presentamos un nuevo enfoque híbrido que combina la inversión de DRC basada en modelos y redes neuronales para realizar simultáneamente la estimación de parámetros de DRC y la restauración de audio.
Supera la dependencia de valores de parámetros exactos, una limitación de los métodos existentes, y logra un rendimiento sólido.
Se demostró un rendimiento superior a las técnicas de última generación existentes en varios conjuntos de datos de música y voz.
Contribuye a restaurar la dinámica original, mejorar la remezcla y mejorar la calidad general del audio en diversos campos, como la producción musical, la transmisión y el procesamiento de voz.
Limitations:
Se necesita más investigación sobre el rendimiento de generalización de la estructura de red neuronal propuesta.
Es necesario evaluar la aplicabilidad y el rendimiento de varios algoritmos y configuraciones de DRC.
Se necesita más investigación para evaluar el rendimiento en entornos acústicos reales y determinar la aplicabilidad práctica.
👍