Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Mejora del rendimiento de la inferencia del lenguaje natural con Knowledge Graph para la verificación automatizada de datos sobre la COVID-19 en idioma indonesio.

Created by
  • Haebom

Autor

Arief Purnama Muharram, Ayu Purwarianti

Describir

Este artículo propone un nuevo modelo que utiliza grafos de conocimiento (GC) para la verificación automatizada de información sobre la COVID-19 en indonesio. Para superar las limitaciones de rendimiento de los métodos existentes de inferencia del lenguaje natural (NLI) basados ​​en aprendizaje profundo, nos centramos en mejorar el rendimiento de la NLI aprovechando los GC como conocimiento externo. El modelo propuesto consta de tres módulos: un módulo de hechos, un módulo de NLI y un módulo clasificador. Procesa la información de los GC y las relaciones semánticas entre las premisas e hipótesis dadas para obtener el resultado final. Tras el entrenamiento con el conjunto de datos de verificación de información sobre la COVID-19 en Indonesia y el GC de COVID-19 en Bahasa Indonesia, obtuvimos una precisión de 0,8616, lo que demuestra la eficacia del uso de GC.

Takeaways, Limitations

Takeaways:
Demostramos que los gráficos de conocimiento (KG) se pueden utilizar para mejorar el rendimiento de los sistemas de verificación de información automatizada basados ​​en inferencia de lenguaje natural (NLI).
Sugerimos la posibilidad de construir un sistema efectivo de verificación de información utilizando KG incluso en entornos lingüísticos con recursos limitados, como el indonesio.
Tiene una gran aplicabilidad no solo para la verificación de información de COVID-19 sino también para el desarrollo de sistemas automatizados de verificación de información en otros campos.
Limitations:
El rendimiento puede verse afectado por el tamaño y la calidad del conjunto de datos utilizado.
Quizás sea necesario tener en cuenta consideraciones adicionales respecto a las características lingüísticas específicas del idioma indonesio.
La integridad y calidad del KG impactan directamente en el rendimiento del modelo. La información inexacta o incompleta en el KG puede generar errores.
Se necesitan más investigaciones para determinar la generalización a otros idiomas.
👍