Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
Cet article propose une nouvelle méthode de correction d'entités nommées (NEC) qui exploite les caractéristiques acoustiques de la parole pour corriger les erreurs de transcription d'entités nommées spécifiques à un domaine dans les systèmes de reconnaissance vocale automatique de bout en bout. Les modèles NEC existants, basés sur la distance d'édition au niveau phonétique, souffrent d'une dégradation des performances lorsque les différences morphologiques entre les mots erronés et corrects sont importantes. Notre méthode surmonte cette limitation en utilisant les caractéristiques acoustiques de la parole pour récupérer les entités candidates, puis en annotant et en remplaçant les entités erronées dans les transcriptions ASR par des entités correctes à l'aide d'un modèle génératif. Les résultats expérimentaux obtenus à l'aide d'ensembles de tests ouverts et auto-construits démontrent que la méthode proposée améliore significativement la précision des entités. Nous prévoyons de rendre notre ensemble de tests auto-construits et nos données d'entraînement accessibles au public.
Takeaways, Limitations
•
Takeaways:
◦
Une nouvelle méthode NEC est présentée qui surmonte les limites des méthodes existantes en utilisant les caractéristiques acoustiques de la voix.
◦
Performance efficace même lorsqu'il existe une grande différence de forme entre le mot d'erreur et la bonne réponse.
◦
Contribue à améliorer la précision des objets
◦
Assurer la reproductibilité et l’évolutivité de la recherche grâce à la publication d’ensembles de données auto-construits.
•
Limitations:
◦
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de la méthode proposée.
◦
Une évaluation des performances dans différents domaines et langues est nécessaire.
◦
La taille et la qualité des ensembles de données auto-construits doivent être revues.