Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
AutoSchemaKG: Construcción autónoma de gráficos de conocimiento mediante la inducción de esquemas dinámicos a partir de corpus a escala web
Created by
Haebom
Autor
Jiaxin Bai, Wei Fan, Qi Hu, Qing Zong, Chunyang Li, Hong Ting Tsang, Hongyu Luo, Yauwai Yim, Haoyu Huang, Xiao Zhou, Feng Qin, Tianshi Zheng, Xi Peng, Xin Yao, Huiwen Yang, Leijie Wu, Yi Ji, Gong Zhang, Renhai Chen, Yangqiu Song
Describir
AutoSchemaKG es un marco para la generación de grafos de conocimiento de forma totalmente autónoma sin un esquema predefinido. Aprovecha modelos de lenguaje a gran escala para extraer triples de conocimiento del texto e inducir simultáneamente un esquema completo, modelando entidades y eventos, y organizando instancias en categorías semánticas mediante la conceptualización. Al procesar más de 50 millones de documentos, construimos un grafo de conocimiento, ATLAS (Automated Triple Linking And Schema Induction), con más de 900 millones de nodos y 5900 millones de aristas. Este enfoque supera los estándares de referencia más avanzados en tareas de preguntas y respuestas de varios pasos y mejora el realismo de LLM. En concreto, la inducción de esquemas logra un 92 % de alineación semántica con los esquemas generados por humanos sin intervención manual, lo que demuestra que un grafo de conocimiento de mil millones de unidades con esquemas inducidos dinámicamente puede complementar eficazmente el conocimiento paramétrico de los modelos de lenguaje a gran escala.
Takeaways, Limitations
•
Takeaways:
◦
Presentamos un nuevo marco para construir gráficos de conocimiento de forma totalmente autónoma sin un esquema predefinido.
◦
Extracción triple de conocimiento y derivación de esquemas simultáneos utilizando modelos de lenguaje a gran escala.
◦
Construcción de un gráfico de conocimiento a escala de mil millones de unidades, ATLAS, para mejorar el desempeño de respuesta a preguntas de múltiples pasos y aumentar la veracidad del LLM.
◦
Los esquemas derivados automáticamente logran una alta alineación semántica (92%) con los esquemas generados por humanos.
◦
Presentamos el potencial de los gráficos de conocimiento con esquemas derivados dinámicamente para complementar eficazmente el conocimiento paramétrico de modelos de lenguaje a gran escala.
•
Limitations:
◦
Limitations no se menciona explícitamente en el artículo. Sería necesario realizar más investigaciones para mejorar la precisión de la derivación del esquema y verificar su aplicabilidad a diversos tipos de datos. Además, podría ser necesario evaluar con mayor detalle la integridad y fiabilidad del grafo de conocimiento generado.