본 논문은 언어 모델의 추론 능력, 특히 반사실적 질문에 대한 인과 추론 능력의 부족 문제를 해결하고자 한다. 기존의 사실 기반 평가 지표의 한계를 극복하기 위해 사실적 질문과 반사실적 질문 모두의 정확도를 고려하는 새로운 평가 지표를 제시한다. 또한, 제시된 지표를 기반으로 언어 모델의 추론 메커니즘을 향상시키는 여러 미세 조정 기법을 제안하고, 다양한 현실적인 시나리오에서 미세 조정된 언어 모델의 성능을 평가한다. 특히, 귀납적 및 연역적 추론 능력을 필요로 하는 여러 문제에서 기본 모델에 비해 미세 조정 기법이 얼마나 체계적으로 더 나은 일반화 성능을 달성하는지 조사한다.