본 논문은 대규모 언어 모델(LLM)의 경로 계획 능력을 평가하기 위한 새로운 벤치마크 GridRoute와, 기존 알고리즘의 지침을 프롬프트에 통합하는 새로운 하이브리드 프롬프팅 기법인 Algorithm of Thought (AoT)를 제안합니다. GridRoute는 다양한 크기의 격자 환경에서 정확성, 최적성, 효율성을 평가하며, 7B~72B 파라미터의 6개 LLM을 대상으로 실험을 진행합니다. 실험 결과, AoT는 모든 모델 크기에서 성능을 크게 향상시키며, 특히 크고 복잡한 환경에서 효과적임을 보여줍니다. 코드는 공개적으로 제공됩니다 (https://github.com/LinChance/GridRoute).