Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

HERGC: Representación de expertos heterogéneos y compleción generativa para gráficos de conocimiento multimodales

Created by
  • Haebom

Autor

Yongkang Xiao, Rui Zhang

Describir

Este artículo propone HERGC, un novedoso marco de autocompletado de grafos de conocimiento multimodal (MMKGC) que aprovecha modelos de lenguaje a gran escala (LLM) para abordar la incompletitud de los grafos de conocimiento multimodal (MMKG) que integran diversas modalidades (p. ej., imágenes y texto). HERGC enriquece y fusiona la información multimodal con buscadores de representación experta heterogéneos para recuperar un conjunto de candidatos para cada tripleta incompleta y, posteriormente, identificar con precisión la respuesta correcta mediante un predictor LLM generativo implementado mediante aprendizaje en contexto o ajuste fino ligero. Experimentos exhaustivos con tres referencias MMKG estándar demuestran que HERGC supera a los métodos existentes.

Takeaways, Limitations

Takeaways:
Un nuevo enfoque para utilizar eficazmente el LLM en MMKGC
Mejora del rendimiento de finalización de MMKG mediante la fusión de información heterogénea y el uso de modelos generativos.
Contribuye a resolver el supuesto de mundo cerrado y el problema del objetivo de aprendizaje diferencial del método MMKGC existente Limitations
Excelente rendimiento verificado en varios puntos de referencia de MMKG
Limitations:
Altos costos computacionales y consumo potencial de recursos debido al uso de LLM
Se necesitan más investigaciones sobre la explicabilidad y confiabilidad del LLM.
Posible sesgo de rendimiento para tipos específicos de MMKG o modalidades
Puede depender del rendimiento del LLM utilizado.
👍