Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Inversion de compression de plage dynamique à amélioration neuronale : une approche hybride pour restaurer la dynamique audio

Created by
  • Haebom

Auteur

Haoran Sun, Dominique Fourer, Hichem Maaref

Contour

Cet article présente une approche hybride combinant la transformée inverse basée sur un modèle et les réseaux de neurones pour résoudre le problème de la transformée inverse de la compression de la plage dynamique (DRC). Pour surmonter les limites des méthodes existantes, qui négligent les paramètres clés ou s'appuient sur des valeurs de paramètres précises, nous utilisons des réseaux de neurones (classification et régression) pour estimer les paramètres de la DRC et reconstruire le signal d'origine. Les résultats expérimentaux sur divers ensembles de données musicales et vocales démontrent que la méthode proposée surpasse les techniques de pointe existantes en termes de performances et de robustesse.

Takeaways, Limitations

Takeaways:
Nous présentons une nouvelle approche hybride qui combine l'inversion DRC basée sur un modèle et les réseaux neuronaux pour effectuer simultanément l'estimation des paramètres DRC et la restauration audio.
Surmonte la dépendance aux valeurs de paramètres exactes, une limitation des méthodes existantes, et atteint des performances robustes.
A démontré des performances supérieures aux techniques de pointe existantes sur divers ensembles de données musicales et vocales.
Contribue à restaurer la dynamique d'origine, à améliorer le remixage et à améliorer la qualité audio globale dans divers domaines tels que la production musicale, la diffusion et le traitement de la voix.
Limitations:
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de l’architecture de réseau neuronal proposée.
L’applicabilité et l’évaluation des performances de divers algorithmes et paramètres DRC sont nécessaires.
Des recherches supplémentaires sont nécessaires pour évaluer les performances dans des environnements acoustiques réels et pour déterminer l’applicabilité pratique.
👍