본 논문은 자원 제약 환경에서 배포되는 소규모 언어 모델의 제한된 도메인 지식, 환각 현상, 제한된 추론 깊이 문제를 해결하기 위해 단계별 지식 그래프 검색과 단계별 추론을 통합하는 새로운 패러다임인 그래프 증강 추론(graph-augmented reasoning)을 제시합니다. 기존의 대규모 언어 모델(LLM) 추론의 한계를 극복하기 위해, 추가적인 훈련 없이 동결된 소규모 LLM이 관련 수학적 지식을 단계적으로 검색하고 처리하여 문제 해결 능력을 향상시키는 것을 목표로 합니다. 이를 위해, 프로세스 중심의 지식 그래프 구축, 계층적 검색 전략, 검색된 정보를 개선하고 각 추론 단계를 평가하는 보편적인 사후 검색 처리 및 보상 모델(PRP-RM)을 중심으로 하는 KG-RAR 프레임워크를 제안합니다. Math500과 GSM8K 벤치마크에서 6가지 모델에 대한 실험을 통해 KG-RAR이 Llama-3B를 사용하여 Math500에서 20.73%의 상대적 성능 향상을 달성하는 등 고무적인 결과를 보여줍니다.