Este artículo propone un marco de Razonamiento de Conflictos de Conocimiento (RCC) para abordar los desafíos que enfrentan los modelos de lenguaje a gran escala (MLC) al gestionar conocimiento conflictivo de múltiples fuentes, en particular los conflictos de conocimiento entre contextos. La idea central del RCC es entrenar a los MLC, mediante aprendizaje por refuerzo, para que seleccionen y se adhieran a contextos con mayor consistencia lógica en contextos conflictivos extensos. Primero, se extraen rutas de inferencia, representadas como texto o grafos de conocimiento local, de contextos conflictivos extensos. Posteriormente, el aprendizaje por refuerzo guía al modelo para que aprenda el proceso de inferencia que sigue la ruta correcta. Los resultados experimentales demuestran que el marco del RCC mejora significativamente la capacidad de diversos MLC para resolver conflictos de conocimiento en contextos extensos.