본 논문은 계획 문제 해결을 위한 대규모 언어 모델(LLM)의 활용에 초점을 맞추고 있습니다. 기존 연구들이 유연성을 위해 건전성을 희생하는 경우가 많았던 반면, Thought of Search (ToS)는 코드로 검색 공간을 정의하고 LLM이 해당 코드를 생성하는 방식을 제안했습니다. ToS는 사람의 개입을 필요로 하지만, 모든 테스트 데이터셋에서 100% 정확도를 달성했습니다. 본 논문은 ToS 과정의 자동화를 위한 첫걸음으로 AutoToS를 제시합니다. AutoToS는 LLM과의 상호작용에서 사람의 개입을 제거하고, 일반적 및 도메인 특정 단위 테스트의 피드백을 통해 LLM을 단계적으로 안전하고 완전한 검색 구성 요소 생성으로 안내합니다. 평가된 모든 도메인에서 소량의 LLM 호출만으로 100% 정확도를 달성함을 보여줍니다.