본 논문은 대규모 추론 모델(LRM)이 다단계 추론과 적절한 단계에서 검색 엔진을 호출하는 능력을 보여주었지만, 기존의 검색 증강 추론 접근 방식은 별도의 검색 모델에 의존하여 LRM의 역할을 검색 시점과 쿼리 방법 결정으로 제한한다는 문제점을 지적합니다. 이러한 분리는 하드웨어 및 운영 비용을 증가시킬 뿐만 아니라, 검색기의 임베딩 공간이 생성기의 요구 사항을 충족하기에 충분하지 않은 표현 병목 현상으로 인해 검색 과정에서 오류를 발생시킵니다. 이를 해결하기 위해 본 논문은 시퀀스-투-시퀀스 매칭에서 벗어나 코퍼스 내 답변이 포함된 경로를 찾는 관점으로 전환하고, FREESON(Retriever-FREE Retrieval-Augmented ReaSONing)이라는 새로운 프레임워크를 제안합니다. FREESON은 LRM이 생성기이자 검색기 역할을 수행하여 관련 지식을 직접 검색할 수 있도록 합니다. 이를 위해 본 논문은 검색 작업에 특화된 MCTS 알고리즘의 변형인 CT-MCTS(Corpus-Traversing Monte Carlo Tree Search)를 도입하여 LRM이 답변이 포함된 영역을 향해 코퍼스를 탐색하도록 합니다. 5개의 오픈 도메인 QA 벤치마크(단일 홉 및 다중 홉 질문 포함)에 대한 실험 결과, FREESON은 별도의 검색기를 사용하는 4개의 다단계 추론 모델에 비해 EM 및 F1에서 평균 14.4% 향상되었으며, 최강 기준 모델과 비슷한 성능을 보였고 PopQA 및 2WikiMultihopQA에서는 각각 3% 및 2% 우수한 성능을 보였습니다.