본 논문은 대규모 언어 모델 기반 추론 시스템의 비효율성을 해결하기 위해 그래프 구조의 메모리를 활용하여 추론 워크플로우를 저장하고 재사용하는 Graph-Memoized Reasoning (GMR) 프레임워크를 제안합니다. GMR은 과거의 결정 그래프를 인코딩하고 구조적 및 의미적 유사성을 통해 검색하여 새로운 추론 작업에서 하위 그래프를 구성적으로 재사용할 수 있게 합니다. 또한, 효율성과 일관성 사이의 균형을 맞추기 위한 최적화 목표를 제시하며, 해석 가능하고 비용 효율적인, 그리고 자기 개선이 가능한 추론 아키텍처 구축을 위한 기반을 마련합니다.