Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
Este artículo propone un nuevo método de corrección de entidades nombradas (NEC) que aprovecha las características acústicas del habla para corregir errores de transcripción de entidades nombradas específicos del dominio en sistemas de reconocimiento automático de voz de extremo a extremo. Los modelos NEC existentes basados en la distancia de edición a nivel fonético sufren una degradación del rendimiento cuando las diferencias morfológicas entre palabras erróneas y correctas son grandes. Nuestro método supera esta limitación utilizando características acústicas del habla para recuperar entidades candidatas y, posteriormente, anotando y reemplazando errores de entidad en transcripciones de ASR con entidades correctas mediante un modelo generativo. Los resultados experimentales, utilizando conjuntos de prueba abiertos y autoconstruidos, demuestran que el método propuesto mejora significativamente la precisión de la entidad. Planeamos publicar nuestro conjunto de prueba autoconstruido y los datos de entrenamiento.
Takeaways, Limitations
•
Takeaways:
◦
Se presenta un nuevo método NEC que supera las limitaciones de los métodos existentes al utilizar las características acústicas de la voz.
◦
Rendimiento eficaz incluso cuando hay una gran diferencia de forma entre la palabra de error y la respuesta correcta.
◦
Contribuye a mejorar la precisión de los objetos.
◦
Garantizar la reproducibilidad y escalabilidad de la investigación mediante la publicación de conjuntos de datos propios.
•
Limitations:
◦
Se necesita más investigación sobre el rendimiento de generalización del método propuesto.
◦
Es necesaria una evaluación del rendimiento en varios dominios y lenguajes.
◦
Es necesario revisar el tamaño y la calidad de los conjuntos de datos autoconstruidos.