본 논문은 대규모 구조화된 지식베이스(KB)를 사용하여 자연어 질문에 답하는 지식베이스 질의응답(KBQA) 시스템인 KBQA-o1을 제안합니다. 기존 KBQA 시스템이 지식베이스 인식 부족, 효율성과 효과의 불균형, 그리고 주석 데이터에 대한 높은 의존성과 같은 문제점을 가지고 있음을 지적하며, 이를 해결하기 위해 몬테카를로 트리 탐색(MCTS)을 활용한 새로운 에이전트 기반 KBQA 방법론을 제시합니다. KBQA-o1은 ReAct 기반 에이전트 프로세스를 통해 단계적인 논리 형태 생성 및 KB 환경 탐색을 수행하며, 정책 및 보상 모델에 의해 주도되는 MCTS를 사용하여 에이전트 탐색의 성능과 탐색 공간의 균형을 맞춥니다. 휴리스틱 탐색을 통해 생성된 고품질 주석을 이용하여 추가적인 증분식 미세조정을 수행합니다. 실험 결과, KBQA-o1은 제한된 주석 데이터를 가진 기존의 저자원 KBQA 방법들을 능가하며, Llama-3.1-8B 모델의 GrailQA F1 성능을 48.5%에서 78.5%로 향상시켰습니다. 소스 코드는 공개적으로 이용 가능합니다.