[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Alineación de gráficos de conocimiento y modelos de lenguaje para lograr precisión factual

Created by
  • Haebom

Autor

Nur A Zarin Nishat, Andrea Coletta, Luigi Bellomarini, Kossi Amouzouvi, Jens Lehmann, Sahar Vahdati

Describir

En este artículo, presentamos un método novedoso, denominado ALIGNed-LLM, para abordar el problema de las alucinaciones en modelos lingüísticos mediante la integración eficiente de grafos de conocimiento (GC) en el espacio latente de dichos modelos. Inspirados en el LLaVA original, alineamos entidades e incrustaciones de texto utilizando modelos de incrustación de grafos de conocimiento (GEC) preentrenados, como TransE, y una capa de proyección aprendible. Esto permite que el modelo lingüístico distinga entidades similares, mejore su base factual y reduzca las alucinaciones. Realizamos experimentos con tres conjuntos de datos de referencia de preguntas y respuestas y modelos lingüísticos de diversos tamaños, y demostramos mejoras significativas en el rendimiento. También aplicamos el método a un caso práctico financiero real de un importante banco central europeo y verificamos la mejora en la precisión.

Takeaways, Limitations

Takeaways:
Presentamos un método novedoso para integrar eficientemente gráficos de conocimiento en modelos de lenguaje.
Se ha demostrado experimentalmente una reducción de los problemas de alucinaciones y una mejora en la precisión de los hechos.
Verificación de la practicidad mediante su aplicación en campos financieros reales.
Sugiriendo aplicabilidad a modelos de lenguaje de varios tamaños.
Limitations:
Dependencia de un modelo KGE específico (TransE). Falta de análisis comparativo del rendimiento de otros modelos KGE.
El rendimiento puede verse afectado por la calidad y la integridad del gráfico de conocimiento utilizado.
Las aplicaciones reales en el sector financiero se limitan a una institución específica. Se requiere mayor verificación de su generalización a diversos campos e instituciones.
👍