본 논문은 대규모 언어 모델(LLM)의 추론 능력 향상을 위해 추론 시간 계산을 늘리는 최근 연구를 바탕으로, 반복적 샘플링의 한계를 극복하는 새로운 추론 시간 프레임워크인 적응적 분기 몬테 카를로 트리 탐색(AB-MCTS)을 제안합니다. AB-MCTS는 외부 피드백 신호를 기반으로 새로운 후보 응답을 확장할지(넓게 가기) 아니면 기존 응답을 재검토할지(깊게 가기) 동적으로 결정하여 반복적 샘플링보다 효율적인 다회차 탐색 및 활용을 가능하게 합니다. 복잡한 코딩 및 엔지니어링 작업에 대한 실험 결과, AB-MCTS는 반복적 샘플링과 표준 MCTS를 모두 능가하며, LLM의 응답 다양성과 다회차 솔루션 개선을 결합하는 것이 효과적인 추론 시간 확장에 중요함을 보여줍니다.