Este artículo propone un marco de Razonamiento de Conflictos de Conocimiento (RCC) para abordar el problema de los modelos de lenguaje a gran escala (MLC) que luchan por resolver conflictos de conocimiento provenientes de múltiples fuentes, en particular conflictos de conocimiento en contextos conflictivos en textos extensos. El RCC se basa en el aprendizaje por refuerzo para entrenar a los MLC a seleccionar y adherirse a contextos con mayor consistencia lógica cuando se presentan en contextos conflictivos. Primero, extrae rutas de inferencia, expresadas como texto o grafos de conocimiento local, de contextos de texto extenso conflictivos. Con base en estas rutas, el modelo se entrena para seguir la ruta de inferencia correcta, mejorando así su capacidad para resolver conflictos de conocimiento en contextos de texto extenso. Los resultados experimentales demuestran que el marco propuesto mejora significativamente la capacidad de resolución de conflictos de conocimiento de varios MLC.