Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

KCR: Resolución de conflictos de conocimiento de largo contexto mediante razonamiento en LLM

Created by
  • Haebom

Autor

Xianda Zheng, Zijian Huang, Meng-Fen Chiang, Michael J. Witbrock, Kaiqi Zhao

Describir

Este artículo propone un marco de Razonamiento de Conflictos de Conocimiento (RCC) para abordar los desafíos que enfrentan los modelos de lenguaje a gran escala (MLC) al gestionar conocimiento conflictivo de múltiples fuentes, en particular los conflictos de conocimiento entre contextos. La idea central del RCC es entrenar a los MLC, mediante aprendizaje por refuerzo, para que seleccionen y se adhieran a contextos con mayor consistencia lógica en contextos conflictivos extensos. Primero, se extraen rutas de inferencia, representadas como texto o grafos de conocimiento local, de contextos conflictivos extensos. Posteriormente, el aprendizaje por refuerzo guía al modelo para que aprenda el proceso de inferencia que sigue la ruta correcta. Los resultados experimentales demuestran que el marco del RCC mejora significativamente la capacidad de diversos MLC para resolver conflictos de conocimiento en contextos extensos.

Takeaways, Limitations

Takeaways:
Se presenta un nuevo marco (KCR) para contribuir a mejorar la capacidad de resolver conflictos de conocimiento en el contexto a largo plazo del LLM.
Presentar la posibilidad de aprender y mejorar el proceso de inferencia de LLM a través del aprendizaje por refuerzo.
Se ha demostrado experimentalmente que es un marco general aplicable a varios LLM.
Limitations:
La evaluación del desempeño del marco propuesto puede limitarse a un conjunto de datos específico.
Problemas de complejidad y eficiencia en el proceso de extracción de rutas de inferencia.
Se necesita más investigación sobre el rendimiento de la generalización en situaciones complejas del mundo real.
👍